Comment l’IA protège les langues régionales en Indonésie

Préserver les langues régionales grâce à l’IA : un enjeu crucial pour l’Indonésie
En Indonésie, de nombreuses langues régionales sont menacées d’extinction en raison de la modernisation du pays. Avec plus de 700 langues régionales et près de 800 dialectes à travers l’archipel, le gouvernement indonésien se tourne vers l’intelligence artificielle pour les préserver et les rendre accessibles à la population.
L’importance des grandes modèles de langage pour préserver les langues en Indonésie
Des modèles de langage tels que GPT d’OpenAI, Gemini de Google et Llamma de Meta sont principalement entraînés en anglais, excluant ainsi des milliards de locuteurs de langues moins répandues en ligne. Les nations non anglophones cherchent à combler ce fossé en construisant leurs propres modèles de langage multilingues dans des langues à faibles ressources et en voie de disparition.
Pour former ces modèles de langage, des données de haute qualité en grande quantité sont nécessaires. Cependant, ces données sont souvent rares dans les langues régionales, ce qui soulève des préoccupations quant à la représentativité culturelle des modèles créés.
L’initiative de Yellow.AI pour préserver les langues locales indonésiennes
Cette année, Yellow.AI a lancé Komodo-7B, un modèle de langage entraîné sur le Bahasa Indonesia et 11 autres langues régionales, notamment le javanais, le balinais et le sundanais. Bien que Komodo-7B soit actuellement destiné à des applications commerciales, sa vocation première est de préserver les langues et dialectes locaux à l’avenir grâce à une forte digitalisation.
Malgré ces avancées, la digitalisation et la préservation des langues régionales restent un défi en Indonésie. L’accès limité aux données et la domination de l’anglais soulèvent des inquiétudes quant à la conservation de la diversité linguistique du pays. Cependant, les collaborations entre entreprises et institutions locales montrent un engagement fort envers la préservation de ces langues anciennes et riches d’histoire.
Source : restofworld.org