Meta et Mistral dévoilent de nouveaux LLM open-source puissants et compétitifs.
Aperçu des dernières innovations en matière de LLMs open source dans le domaine de l’IA
Méta et Mistral lancent de nouveaux LLMs plus performants
La semaine dernière, Méta et Mistral ont lancé deux nouveaux LLMs open source qui se distinguent par leurs performances accrues et leur meilleur rapport qualité-prix.
Llama 3.1 405b est le plus grand modèle de Méta, contenant 405 milliards de paramètres. Selon la société, il est concurrentiel avec les principaux LLMs tels que le GPT-4o d’OpenAI et le Claude 3.5 Sonnet d’Anthropic.
Disponible en téléchargement ou sur des plateformes cloud comme AWS, Azure et Google Cloud, Llama 3.1 405b est actuellement utilisé sur WhatsApp et Meta.ai.
Fonctionnalités de Llama 3.1 405b et Mistral Large 2
Tout comme Mistral Large 2, le dernier modèle de Méta peut effectuer diverses tâches, de la programmation à la réponse à des questions de mathématiques de base, en passant par la synthèse de documents dans huit langues (anglais, allemand, français, italien, portugais, hindi, espagnol et thaï).
Cependant, ces modèles ne sont pas multimodaux, ce qui signifie qu’ils ne peuvent pas répondre, par exemple, à des questions sur une image.
Dans ce domaine, OpenAI est en avance sur la concurrence en ce qui concerne les systèmes d’IA multimodaux qui traitent simultanément des images et du texte.
Fonctionnalités avancées de Mistral Large 2
Dans son annonce, la start-up AI basée à Paris, Mistral, a déclaré que Large 2 est “nettement plus performant en génération de code, mathématiques et raisonnement, et offre un support multilingue bien plus fort ainsi que des capacités avancées d’appel de fonctions”.
Il est à la hauteur des principaux modèles tels que GPT-4o, Claude 3 Opus et Llama 3 405B, selon Mistral.
Ce modèle offre une fenêtre de 128 000 tokens (environ un livre de 300 pages en une seule requête.) Il est également formé pour reconnaître quand il ne peut pas trouver de solutions ou n’a pas suffisamment d’informations pour fournir une réponse confiante.
Ce modèle est disponible via la Plateforme sous le nom de mistral-large-2407 et peut également être utilisé sur Google Vertex AI, Amazon Bedrock, Azure AI Studio et IBM Watsonx.ai. Les poids pour le modèle instruct sont disponibles et sont également hébergés sur HuggingFace. Cependant, il n’est pas entièrement open source, toute application commerciale nécessitant une licence payante.
Source : iblnews.org