13 avril 2025

Krusell France

Ta dose d'actu digital !

Introducing Aviary: Un Gymnase Open-Source pour Agents Linguistiques

FutureHouse Researchers Propose Aviary: An Extensible Open-Source Gymnasium for Language Agents
Rate this post

Les avancées de l’intelligence artificielle (IA) dans le domaine des modèles de langage sont remarquables et permettent de résoudre des problèmes complexes. Cependant, l’application de ces modèles à des défis scientifiques réels reste difficile. De nombreux agents d’IA rencontrent des difficultés avec des tâches nécessitant plusieurs cycles d’observation, de raisonnement et d’action. De plus, les modèles existants manquent souvent de capacité à intégrer efficacement des outils ou à maintenir une cohérence dans le raisonnement à plusieurs étapes. Ces problèmes sont particulièrement préoccupants dans les domaines scientifiques où les tâches exigent précision, adaptabilité et efficacité computationnelle. Pour résoudre ces problèmes, il est nécessaire de disposer d’un cadre flexible et pratique pour entraîner et déployer des agents de langage.

Introduction d’Aviary: Une gymnastique open-source extensible

Une équipe de chercheurs de FutureHouse Inc., de l’Université de Rochester et de l’Institut Francis Crick a introduit Aviary, une gymnastique open-source pour les agents de langage. Aviary répond aux limitations des cadres existants en introduisant des processus décisionnels de langage (PDL), qui modélisent les tâches comme des processus de décision de Markov partiellement observables ancrés dans le langage naturel. Cette approche permet aux agents de langage de gérer efficacement des tâches complexes de raisonnement à plusieurs étapes.

Les environnements inclus dans Aviary

Aviary comprend cinq environnements, dont trois sont conçus pour des tâches scientifiques avancées :

Molecular Cloning: Manipulation de constructions d’ADN à l’aide d’outils d’annotation de séquences et de planification de protocoles.

Scientific Literature QA: Récupération et analyse de la littérature scientifique pour répondre à des questions de recherche détaillées.

Protein Stability Engineering: Proposition de mutations protéiques pour améliorer la stabilité à l’aide d’outils informatiques et biochimiques.

Ces tâches font d’Aviary une plateforme précieuse pour l’entraînement et l’évaluation des agents de langage dans des scénarios réels nécessitant du raisonnement, une intégration d’outils et un apprentissage itératif.

Avantages techniques et perspectives d’Aviary

Aviary utilise un cadre de graphe de calcul stochastique pour modéliser les agents de langage, permettant une optimisation flexible et efficace. Les caractéristiques clés comprennent :

  • Expert Iteration (EI): Une méthode d’entraînement qui affine de manière itérative les agents en utilisant des trajectoires de haute qualité.
  • Majority Voting: Une technique pour améliorer la précision en combinant les sorties de plusieurs inférences sans surcharge computationnelle excessive.
  • Intégration d’outils: Support intégré pour des outils comme les annotateurs de séquences et les systèmes de récupération de littérature, améliorant l’applicabilité réelle.

– Les chercheurs montrent que des modèles open-source non-frontaliers comme Llama-3.1-8B-Instruct peuvent atteindre des performances comparables ou meilleures que les modèles frontières (par exemple, Claude 3.5 Sonnet) dans ces environnements. De plus, ces modèles fonctionnent à des coûts d’inférence nettement inférieurs, les rendant accessibles pour des applications scientifiques à grande échelle.

Résultats et perspectives

Les agents entraînés par Aviary démontrent des performances impressionnantes :

  • Dans les tâches de clonage moléculaire, l’agent Llama-3.1-8B-Instruct a montré des améliorations de l’exactitude notables grâce à EI et au clonage de comportements, surpassant les experts humains sur les bancs d’essai SeqQA.
  • Dans les tâches de questions/réponses sur la littérature scientifique, le même modèle a atteint des niveaux de performance équivalents ou supérieurs à ceux des humains, tout en maintenant l’efficacité.
  • Le vote à la majorité a renforcé davantage l’exactitude, les résultats de SeqQA atteignant 89% après l’échantillonnage de multiples trajectoires, dépassant les benchmarks des humains et des modèles frontières.

Conclusion

Aviary représente une avancée réfléchie dans le développement des agents de langage en IA. En démontrant que des modèles open-source, non-frontaliers peuvent exceller dans les tâches scientifiques, Aviary ouvre de nouvelles possibilités pour la recherche en IA accessible et rentable. Sa conception open-source encourage la collaboration, permettant aux chercheurs et aux développeurs d’affiner et d’étendre davantage ses applications.

Avec des outils et des méthodes d’entraînement adaptés aux défis réels, Aviary établit une référence pour la manière dont les agents de langage peuvent relever des tâches complexes. Il offre un cadre convaincant pour faire avancer l’exploration scientifique pilotée par l’IA et la résolution pratique de problèmes.

Source : www.marktechpost.com

  • mia dufresne portrait redactrice

    Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.

    Voir toutes les publications