Les nouvelles classifications de Gemini - Analyse approfondie des émissions NewPropos recents de IA.

Rate this post

Classification de la programmation d’une chaîne d’actualités

Sommaire masquer

1 Gemini fait face à des résultats changeants

2 Liste de programmes non liés à l’actualité

3 Recherche sur la classification de Gemini

4 Analyse des programmes non liés à l’actualité

5 Conclusion

6 Actualités similaires :

Gemini fait face à des résultats changeants

La semaine dernière, nous avons utilisé Gemini pour classifier une décennie de titres d’émissions EPG sur une seule chaîne d’actualités télévisées en tant que nouvelles/non nouvelles. Il a été souligné qu’au moins cinq d’entre eux ne semblaient pas être des programmes liés à l’actualité. En relançant Gemini sur cette liste de cinq titres plusieurs fois une semaine plus tard, les résultats changent à chaque fois. En relançant la liste complète des 1 498 titres de programmes EPG uniques, nous obtenons des résultats très différents de la dernière fois. Quelque chose d’autre émerge également. La semaine dernière, Gemini 1.5 Pro a filtré les 1 498 titres de programme uniques et a retourné une liste de 837 titres qu’il a déterminés être des nouvelles. Une revue de cette liste révèle une découverte surprenante: sur ces 837 titres, plus de la moitié était des répétitions incorrectes de titres par Gemini, avec Gemini retournant en fait seulement 343 titres uniques parmi cette liste de 837 entrées. En relançant la liste originale des 1 498 titres une semaine plus tard, Gemini retourne 242 titres “uniques”, dont 181 sont effectivement uniques, ce qui suggère que cette duplication aléatoire pendant les tâches de filtrage est endémique. Pis encore, la semaine dernière, Gemini a retourné 202 titres de programmes uniques comme étant des nouvelles qu’il a marquées comme non nouvelles cette fois-ci, alors qu’il a ajouté 40 titres cette fois-ci comme nouvelles qu’il avait marqués comme non nouvelles la dernière fois. Cela soulève des préoccupations existentielles sur la façon dont les LLM peuvent être utilisés pour des tâches de classification comme celle-ci, qui nécessiteront une enquête plus approfondie.

Liste de programmes non liés à l’actualité

Voici une liste de cinq programmes non liés à l’actualité, mais que Gemini avait signalés la semaine dernière comme des nouvelles:

Lifestyles - NEWS, Brain Health - NEWS, Jalen Jacoby - NEWS, True Crime 2023 Who Stole My Life - NEWS, Brazil Butt Lift - NEWS

Recherche sur la classification de Gemini

Essayons de comprendre pourquoi Gemini a sélectionné ces programmes comme étant des nouvelles:

Lifestyles – NEWS

Brain Health – NEWS

Jalen Jacoby – NEWS

True Crime 2023 Who Stole My Life – NEWS

Analyse des programmes non liés à l’actualité

Alors que revenant sur les entrées de Brain Health et Lifestyles, aucune mention n’est faite de Jalen Jacoby et True Crime:

Nous aurions tort de considérer que ces programmes ne sont pas des actualités. En réalité, les titres “Brain Health” et “Lifestyles” pourraient potentiellement être utilisés pour des programmes liés à l’actualité, mais ils sont beaucoup plus susceptibles d’être les titres de programmes:

Pour être considéré comme une actualité, un programme aurait typiquement pour but de:

Relater des événements actuels: Les programmes d’actualités se concentrent sur ce qui se passe dans le monde en ce moment.
Présenter des informations factuelles: Ils visent à fournir des informations précises et impartiales.
Inclure des interviews avec des experts et des témoins: Ils recueillent souvent les perspectives des personnes directement impliquées dans les histoires qu’ils couvrent.

Sans plus de contexte, il est impossible de dire de manière définitive si “Brain Health” et “Lifestyles” sont des programmes d’actualités. Ils pourraient l’être, mais ils sont plus susceptibles d’être autre chose.

Conclusion

En somme, Gemini fait face à des défis dans la classification des programmes d’actualités, ce qui soulève des questions sur l’efficacité des LLM dans de telles tâches. Les résultats fluctuants et les nombreux doublons indiquent un besoin d’examiner de plus près comment les outils d’IA sont utilisés dans des applications critiques comme la classification des programmes de télévision.

Source : blog.gdeltproject.org

Mia Dufresne
Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.
Voir toutes les publications