14 mars 2025

Krusell France

Ta dose d'actu digital !

Google lance Gemini Flash 2.0 : révolution dans la génération d’art par IA

The Google Gemini logo against a black background.
Rate this post

Google Gemini Flash 2.0 : Un nouvel outil révolutionnaire pour la création d’art avec l’IA

La génération d’art par intelligence artificielle évolue à une vitesse fulgurante, et Google vient tout juste de lancer un nouveau concurrent de taille grâce à son Gemini Flash 2.0. Vous pouvez désormais jouer avec ce nouvel outil de création d’images dans le AI Studio de Google. Gemini Flash est, comme son nom l’indique, très rapide, nettement plus rapide que DALL-E 3 et d’autres créateurs d’images. Cette rapidité pourrait signifier des images de moindre qualité, mais ce n’est pas le cas ici, notamment en raison de tous les changements et améliorations apportés à l’aptitude du modèle à produire des images. Cependant, pour obtenir des résultats vraiment bons, vous devez savoir comment communiquer avec l’IA. Après de nombreux essais et erreurs, nous avons compilé cinq conseils pour obtenir le meilleur art possible avec Gemini Flash 2.0. Certains de ces conseils peuvent sembler similaires à des conseils sur d’autres créateurs d’art par IA, car c’est effectivement le cas, mais cela ne les rend pas moins utiles dans ce contexte.

Raconter une histoire

L’élément le plus intéressant de la nouvelle fonctionnalité de création d’images de Gemini Flash est qu’il ne convient pas seulement à des illustrations ponctuelles, mais peut également vous aider à créer une histoire visuelle en générant une série d’images liées avec un style, des paramètres et des ambiances cohérents. Pour commencer, il vous suffit de lui demander de vous raconter une histoire et à quelle fréquence vous souhaitez une illustration pour accompagner l’action. Le résultat inclura ces images accompagnant le texte. Pour mon projet, j’ai demandé à l’IA de “Générer une histoire d’un bébé dragon héroïque qui a protégé une reine des fées contre un sorcier maléfique dans un style d’animation 3D. Pour chaque scène, générez une image.” J’ai vu le début ci-dessus apparaître. Et, s’il y a un problème, vous pouvez réécrire une partie de l’histoire et le modèle régénérera l’image en conséquence.

Être très spécifique

Si vous demandez à Gemini de créer “un chien dans un parc”, vous risquez d’obtenir un retriever doré flou assis quelque part vaguement vert. Mais si vous dites “Un retriever doré moelleux assis sur un banc en bois à Central Park en automne, avec des feuilles rouges et oranges dispersées au sol”, vous obtiendrez exactement ce que vous imaginez. Les modèles IA prospèrent grâce aux détails. Plus vous en donnez, meilleure sera votre image. Ainsi, pour l’image ci-dessus, au lieu de simplement demander une ville au look futuriste, j’ai demandé “Une ville rétro-futuriste au coucher du soleil, avec des enseignes lumineuses roses et bleues, des voitures volantes dans le ciel, et des gens marchant avec des tenues style rétro-futuriste.” Sept secondes plus tard, le résultat est arrivé.

Être conversationnel

Une des choses que j’apprécie le plus avec le nouveau Gemini Flash est que vous pouvez engager une conversation avec lui sans perdre beaucoup de vitesse. Cela signifie que vous n’avez pas besoin de tout faire correctement du premier coup. Après avoir généré une image, vous pouvez littéralement discuter avec l’IA pour apporter des modifications. Vous voulez changer les couleurs ? Ajouter un personnage ? Assombrir l’ambiance lumineuse ? Il vous suffit de demander. Dans l’ensemble d’images ci-dessus, j’ai commencé en demandant “Un coin lecture confortable avec une cheminée, des étagères remplies de romans et un grand fauteuil confortable.” J’ai ensuite affiné en demandant à l’IA de “Faire en sorte qu’il fasse nuit avec un éclairage doux et chaleureux”, puis suivi en demandant d’ “Ajouter un chat endormi sur le fauteuil”, et j’ai conclu en demandant à l’IA de “Donner à la pièce une esthétique vintage, victorienne.” Le résultat final à gauche ressemble presque exactement à ce que j’imaginais, et donne l’impression que Gemini est un assistant artistique, capable de s’adapter à ce que je veux sans avoir à tout recommencer à chaque fois.

Gemini Flash égale ChatGPT

Google a vanté les connaissances du monde réel de Gemini, ce qui signifie que vous pouvez obtenir une précision historique, des détails culturels réalistes et des images fidèles à la réalité si vous le demandez. Bien sûr, cela nécessite d’être spécifique. Par exemple, si vous lui demandez un “guerrier viking”, vous pourriez obtenir quelque chose qui ressemble davantage à un personnage de Game of Thrones. Mais si vous dites “Un guerrier viking historiquement précis du 9e siècle, portant une armure de mailles détaillée, un bouclier rond en bois, et un casque traditionnel nordique”, vous obtiendrez quelque chose de bien plus précis. Pour tester, j’ai demandé à l’IA de créer “Une cité maya ancienne au lever du soleil, avec des pyramides de pierre imposantes, des environs de jungle luxuriante, et des personnes habillées en vêtements mayas traditionnels.” Ce n’est pas parfait, mais cela ressemble beaucoup plus à la réalité que les versions précédentes, qui revenaient parfois avec presque une pyramide égyptienne.

Écrire vite

La plupart des modèles d’images IA ont longtemps eu du mal à rendre un texte, transformant les mots en gribouillis illisibles. Même les modèles les plus performants aujourd’hui qui peuvent le faire prennent un peu de temps pour le faire et le faire correctement peut nécessiter quelques essais. Mais, Gemini Flash est étonnamment bon pour intégrer rapidement et lisiblement le texte dans les images. Être très spécifique peut aider cependant. C’est ainsi que j’ai généré l’image ci-dessus en demandant à l’IA de “Créer une affiche de voyage de style vintage indiquant ‘Visitez Londres’ en typographie audacieuse et rétro, mettant en vedette une illustration stylisée de la ville.”

Source : www.techradar.com

  • mia dufresne portrait redactrice

    Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.

    Voir toutes les publications