5 juillet 2024

Krusell France

Ta dose d'actu digital !

Un nouveau jeu aide l’IA à mieux comprendre et générer du texte

Using ideas from game theory to improve the reliability of language models | MIT News
Rate this post

Les chercheurs du MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) ont développé un “jeu de consensus” visant à améliorer la compréhension et la génération de texte par l’intelligence artificielle. Ce jeu implique deux parties d’un système d’IA : l’une génère des phrases (comme donner des indices) et l’autre essaie de comprendre et d’évaluer ces phrases (comme deviner le message secret).

Amélioration de la performance de l’IA grâce au jeu de consensus

En considérant cette interaction comme un jeu où les deux parties de l’IA travaillent ensemble selon des règles spécifiques pour se mettre d’accord sur le bon message, les chercheurs ont constaté une nette amélioration de la capacité de l’IA à fournir des réponses correctes et cohérentes. Ce nouvel approche de jeu a été testée sur diverses tâches telles que la compréhension de lecture, la résolution de problèmes mathématiques et la tenue de conversations, et a permis à l’IA de performer de manière plus efficace.

Traditionnellement, les grands modèles de langage répondent de deux manières : en générant des réponses directement à partir du modèle (questionnement génératif) ou en utilisant le modèle pour évaluer un ensemble de réponses prédéfinies (questionnement discriminatif), ce qui peut entraîner des résultats différents voire incompatibles.

Un nouveau décodage algorithmique : le classement à l’équilibre

Athul Jacob, doctorant en génie électrique et informatique au MIT et affilié au CSAIL, explique que cette nouvelle approche traite le processus dans son ensemble comme un jeu complexe d’indices et de signaux, où un générateur tente d’envoyer le bon message à un discriminateur en utilisant un langage naturel. Cela implique de trouver les “équilibres approximatifs” menant à un nouvel algorithme de décodage appelé “classement à l’équilibre”. C’est une démonstration passionnante de la manière dont l’intégration de stratégies de jeu théoriques peut résoudre certains grands défis pour rendre les modèles linguistiques plus fiables et cohérents.

Tester cet algorithme sur diverses tâches a permis à l’équipe de constater une amélioration constante des performances des modèles. L’utilisation de l’algorithme ER avec le modèle LLaMA-7B a même surpassé les résultats obtenus par des modèles bien plus volumineux.

Des implications pour l’amélioration des modèles linguistiques

Cette approche innovante du jeu de consensus pourrait avoir un impact significatif sur l’amélioration des performances des modèles de base, conduisant à des réponses plus fiables et cohérentes dans diverses tâches. Cela ouvre la voie à de nouvelles applications potentielles qui pourraient changer la donne dans le domaine du décodage des modèles de langage, offrant ainsi des perspectives prometteuses pour l’avenir de l’IA.

Source : news.mit.edu