Les entreprises d'IA en manque de données : quelles solutions pour l'avenir ?

Rate this post

Les entreprises de technologie et d’IA s’attaquent à une crise de données sans précédent

Sommaire masquer

1 La quête de données des entreprises d’IA

2 L’utilisation de données publiques et “non publiques” par Meta

3 L’épuisement des ressources en ligne disponibles pour la formation en IA

4 Les opportunités offertes par l’IA

5 Conseils sur la capitalisation sur l’IA

6 Actualités similaires :

La quête de données des entreprises d’IA

La course à l’IA a propulsé les indices S&P et NASDAQ, fait les gros titres des rapports commerciaux et technologiques, et est devenue une partie intégrante des appels aux résultats, des sessions de planification stratégique et des conversations informelles autour de la machine à café virtuelle. Ces entreprises d’IA ont rapidement acquis leurs lettres de noblesse, mais alors qu’elles continuent d’apprendre et de croître, elles manquent de carburant : les données.

Pour contrer cela, les entreprises d’IA de premier plan deviennent créatives dans la façon dont elles acquièrent leurs données et ce qu’elles peuvent “crawler” pour entraîner leurs Modèles de Langue à Grande Échelle (ce qui fait fonctionner les principales plates-formes d’IA comme ChatGPT, Google Gemini et Microsoft Copilot). Jusqu’à présent, ces modèles ont été formés sur des données publiques.

L’utilisation de données publiques et “non publiques” par Meta

Meta, la société mère de Facebook, Instagram, Threads et WhatsApp, a récemment annoncé qu’elle commencera à utiliser des données publiques et “non publiques” (contenu utilisateur) sur sa propre plateforme, datant de 2007, pour former son modèle, LLaMA, à partir du 26 juin 2024. Meta a fait cette “annonce” via une notification push à ses utilisateurs basés dans l’Union européenne. Le GDPR de l’UE, souvent considéré comme la réglementation la plus stricte en matière de protection des données et de sécurité, est utilisé comme test de stress pour voir si cela passe les réglementations européennes.

Alors que ces pratiques sont légales, de nombreuses entreprises et utilisateurs basés aux États-Unis se sentent désormais incertains et inquiets face à la dernière annonce de Meta. “Meta va-t-elle s’entraîner sur mes messages personnels?” “Vont-ils commencer à divulguer des secrets commerciaux et des prix que ma société a développés?” La réponse simple à ces questions est “Non.” Cependant, les entreprises devraient revoir leur politique de contenu alors que nous entrons dans la nouvelle ère de la formation en IA.

L’épuisement des ressources en ligne disponibles pour la formation en IA

Les entreprises d’IA ont essentiellement “épuisé internet” pour crawler et s’entraîner. Cela met en perspective la quantité de données incluse dans une réponse typique d’IA. Votre point de données (qu’il s’agisse d’un blog, d’une image, d’une mise à jour de statut ou d’un commentaire) n’est qu’une goutte d’eau dans l’océan de données. La nature d’un LLM offre l’anonymat dans la masse de données nécessaire.

Les opportunités offertes par l’IA

En tant qu’optimistes en IA, nous pensons toujours à cinq ans dans le futur. Nous recherchons des cas d’utilisation commerciale positifs pour les technologies émergentes comme l’IA tout en évaluant et en considérant les risques. Alors que l’idée de se détourner de l’IA peut sembler la plus facile, nous vous encourageons à plonger dans cet océan de données et à voir comment il est utilisé. Si vous êtes préoccupé par le fait que Meta utilise les publications sociales de votre entreprise pour entraîner LLaMA afin de faire ressembler le contenu d’autres entreprises au vôtre, considérez la perspective de ce trésor de données dont il est extrait. De plus, si vous envisagez de poster ailleurs pour éviter que vos données soient utilisées, il est seulement une question de temps avant que d’autres réseaux sociaux ne fassent de même.

En bref, ciblez votre public en fonction de là où se posent leurs regards et des meilleurs objectifs commerciaux et résultats que ces réseaux vous aideront à obtenir. Vos données sont déjà là, sous une forme ou une autre, et l’alternative de ne pas diffuser de contenu et de publicité est largement supérieure aux risques potentiels de piratage par une IA.

Conseils sur la capitalisation sur l’IA

L’IA générative peut faire gagner du temps à votre entreprise et éviter les tâches répétitives, développer ou commencer des flux de travail et faire tourner les engrenages pour la créativité. Nous recommandons d’utiliser l’IA pour démarrer le processus, mais de ne pas devenir excessivement dépendant d’elle pour le résultat final. Par exemple, il n’est pas judicieux pour votre entreprise d’utiliser des images qui ressemblent à celles d’un concurrent ou qui ont une voix écrite incompatible avec celle que vous avez “parlée” pendant une décennie. Donnez à vos employés le pouvoir de vérifier et d’évaluer le contenu et de le rendre le leur. Le contenu généré par l’IA doit être votre source d’inspiration et votre base, mais ne doit jamais être votre produit final.

Source : corridorbusiness.com

Mia Dufresne
Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.
Voir toutes les publications