Gemini 2.5 Pro : Générer des images Ghibli ?

Rate this post

Google a surpris le monde de l’IA en lançant son nouveau modèle Gemini 2.5 Pro disponible pour tous les clients non payants. À l’origine, il était prévu comme une fonctionnalité premium réservée aux abonnés avancés de Gemini, mais la décision de l’entreprise de le rendre accessible à tous les utilisateurs est une réaction à la concurrence croissante, notamment de ChatGPT d’OpenAI et de Claude d’Anthropic.

Sommaire masquer

1 Gemini 2.5 Pro Vs. ses alternatives

2 Pourquoi n’y a-t-il pas de fonction “Ghiblify” dans Gemini 2.5 Pro?

3 Actualités similaires :

Gemini 2.5 Pro Vs. ses alternatives

Essentiellement, Gemini 2.5 Pro est un modèle de raisonnement similaire au GPT-4o mini d’OpenAI et au DeepSeek R1. Google affirme avoir apporté des améliorations significatives dans les domaines des sciences mathématiques, du raisonnement et du codage. Il prétend également avoir d’excellentes performances dans les benchmarks d’IA les plus importants comme Humanity’s Final Exam et LMArena développés par des chercheurs de l’UC Berkeley.

Cependant, alors que le GPT-4o d’OpenAI a attiré l’attention pour ses capacités multimodales transparentes, y compris la génération d’images natives, Google a été vague quant à savoir si Gemini 2.5 Pro peut créer des images par lui-même.

L’affirmation officielle de la société Grok 3 est que le modèle est doté de la capacité de traiter et d’interpréter des images, du texte, des sons, des vidéos, ainsi que des bases de code. Il n’y a pas d’informations spécifiques concernant la génération d’images intégrée, ce qui conduit l’utilisateur à croire qu’il pourrait dépendre d’outils d’IA externes pour accomplir des tâches similaires.

Pourquoi n’y a-t-il pas de fonction “Ghiblify” dans Gemini 2.5 Pro?

Malgré l’émerveillement croissant des utilisateurs de peintures inspirées par Studio Ghibli créées par l’IA, ces derniers ont été choqués d’apprendre le manque de conversions de style en ligne de Gemini 2.5 Pro. Le modèle actuel de Gemini 2.5 Pro ne prend pas en charge les conversions de style en ligne pour le moment.

Cela indique qu’il est possible que le modèle Imagen 3, qui est à la base de la génération d’images de Gemini, n’ait pas la même flexibilité fluide dans l’expression artistique que le ChatGPT d’OpenAI. Par exemple, le GPT-4o est capable de créer de l’art dans le style de Ghibli sans avoir besoin de modèles tiers, ce qui en fait une option populaire pour la créativité alimentée par l’IA.

Source : www.bizzbuzz.news

Mia Dufresne
Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.
Voir toutes les publications