22 décembre 2024

Krusell France

Ta dose d'actu digital !

Mistral dévoile le modèle linguistique Mistral Large 2 rival des géants de l’IA

Mistral promises GPT-4-class perf from a not-so large model • The Register
Rate this post

Une nouvelle intelligence artificielle a été révélée le mercredi par Mistral AI, il s’agit d’un modèle de langage large de 123 milliards de paramètres appelé Mistral Large 2 (ML2), qui se rapproche des meilleurs modèles d’OpenAI, Anthropic et Meta.

Une nouvelle IA révolutionnaire

ML2 présente des similitudes avec les modèles d’OpenAI, Anthropic et Meta, notamment en ce qui concerne la fenêtre de contexte de 128 000 tokens, le support pour “des dizaines” de langues et plus de 80 langages de programmation. La prise en charge de nombreuses langues est l’un des principaux avantages de Mistral par rapport à d’autres modèles ouverts.

Des performances impressionnantes

En termes de performances, ML2 rivalise avec des modèles tels que GPT-4o d’OpenAI, Claude 3.5 Sonnet d’Anthropic, Llama 3.1 405B de Meta, et d’autres, dans divers tests de langues, de programmation et de mathématiques.

Par exemple, dans le populaire benchmark Massive Multitask Language Understanding (MMLU), le dernier LLM de Mistral obtient un score de 84%, tandis que Llama 3.1 405B de Meta atteint 88,6%, et d’autres modèles des scores similaires.

Un modèle performant et économique

Malgré sa performance impressionnante, ML2 parvient à atteindre ces résultats en utilisant moins de ressources que les modèles concurrents, ce qui en fait un choix attrayant pour les applications commerciales. À pleine précision de 16 bits, le modèle de 123 milliards de paramètres nécessite environ 246 Go de mémoire.

Contrairement à d’autres modèles, ML2 offre un haut débit tout en utilisant moins de ressources, ce qui en fait un choix idéal pour de nombreuses applications.

Précision et concision

Mistral met l’accent sur la précision du modèle en évitant les informations inexactes. ML2 a été entraîné à reconnaître quand il n’a pas suffisamment d’informations pour répondre, ce qui devrait améliorer la qualité des réponses du modèle.

Le modèle a également été optimisé pour générer des réponses succinctes, ce qui peut être particulièrement utile dans des contextes professionnels pour réduire les coûts opérationnels.

Une mise à disposition ouverte

ML2 est disponible en open source, mais avec une licence plus restrictive. La licence Mistral Research License permet une utilisation non commerciale et à des fins de recherche, mais nécessite une licence commerciale pour une utilisation en entreprise.

Cette restriction est courante pour les modèles de grande taille en raison des ressources nécessaires pour les développer. Néanmoins, de nombreux modèles plus petits sont disponibles en open source, permettant une adoption plus large.

Source : www.theregister.com

  • mia dufresne portrait redactrice

    Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.

    Voir toutes les publications