5 juillet 2024

Krusell France

Ta dose d'actu digital !

Reddit s’associe à OpenAI pour améliorer ChatGPT – Une vraie révolution !

OpenAI will use Reddit posts to train ChatGPT under new deal
Rate this post

Reddit et OpenAI ont annoncé jeudi que des contenus postés sur Reddit allaient être intégrés à ChatGPT. Ce nouveau partenariat accorde à OpenAI l’accès à l’API de données de Reddit, offrant ainsi à la firme d’IA générative un accès en temps réel aux publications sur Reddit.

Intégration de contenu Reddit dans ChatGPT

Les contenus Reddit seront incorporés dans ChatGPT “et de nouveaux produits”, a déclaré le blog de Reddit. Selon le réseau social, ce partenariat permettra aux outils d’IA d’OpenAI de mieux comprendre et présenter le contenu Reddit, notamment sur les sujets récents. OpenAI commencera également à faire de la publicité sur Reddit.

Partenariat similaire à celui avec Google

Ce partenariat ressemble à celui que Reddit a signé avec Google en février, permettant au géant de la technologie de développer “de nouvelles façons d’afficher le contenu Reddit” et de fournir “des moyens plus efficaces de former des modèles”, a déclaré Reddit à l’époque. Aucun détail financier n’a été divulgué concernant le partenariat entre Reddit et OpenAI, mais celui entre Reddit et Google était apparemment d’une valeur de 60 millions de dollars.

Poussée de la licence de données de Reddit

Cette annonce survient environ un an après que Reddit ait lancé une guerre des API en commençant à facturer l’accès à son API de données. Cela a entraîné la fermeture de nombreuses applications tierces Reddit appréciées et une vaste contestation des utilisateurs. Reddit a indiqué une des raisons de ce changement soudain était d’empêcher les entreprises d’IA d’utiliser gratuitement le contenu Reddit pour former leurs LLM.

Récemment, Reddit a publié une Politique sur le contenu public déclarant : “Malheureusement, nous constatons de plus en plus d’entités commerciales utilisant un accès non autorisé ou abusant d’un accès autorisé pour collecter des données publiques en masse, y compris le contenu public Reddit.”

Discours alimenté par les partenariats en IA

Reddit a clairement exprimé son intérêt pour la conclusion de contrats de licence de données comme étant une partie centrale de son activité. Les partenariats IA suscitent des discussions sur l’utilisation du contenu généré par les utilisateurs pour alimenter les modèles d’IA sans que les utilisateurs ne soient rémunérés.

OpenAI est également confronté au défi de travailler avec les données Reddit qui, comme une grande partie de l’Internet, peuvent contenir des inexactitudes et des contenus inappropriés. Malgré cela, les firmes d’IA générative sont désireuses de puiser dans les conversations en temps réel de Reddit sur une variété de sujets. Reddit semble tout aussi désireux de proposer la licence des données issues des publications de ses utilisateurs.

Source : arstechnica.com

  • Mia Dufresne

    Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.

    Voir toutes les publications