18 décembre 2024

Krusell France

Ta dose d'actu digital !

Découvrez Imagen 3 et Whisk : les dernières innovations de Google en matière d’IA

Meet Whisk, Google's New Visual-First Approach to AI Image Generation
Rate this post

Aujourd’hui, Google a dévoilé Veo 2 et a également lancé une nouvelle version mise à jour d’Imagen 3 à l’échelle mondiale, en introduisant Whisk, un nouvel outil ludique de génération d’images dans Google Labs.

Points clés :

Imagen 3 est déployé à l’échelle mondiale pour les utilisateurs d’ImageFX dans plus de 100 pays avec une amélioration de la composition et du rendu du style.

Whisk combine Imagen 3 avec la compréhension visuelle de Gemini pour “remixer” des images.

Les utilisateurs peuvent mélanger les images de sujet, de scène et de style pour créer des designs personnalisés tels que des peluches digitales et des épingles émaillées.

Le modèle Imagen 3 mis à jour est désormais disponible via ImageFX dans plus de 100 pays. Selon Google, le modèle produit des images plus lumineuses avec des détails et des textures plus riches, tout en interprétant de manière plus précise les instructions des utilisateurs à travers une gamme plus large de styles artistiques – des rendus photoréalistes aux œuvres impressionnistes et anime. Voici quelques exemples d’images :

En parallèle de cette mise à jour, Google Labs lance Whisk, une nouvelle approche de la génération d’images par IA qui s’éloigne des instructions traditionnelles en texte. Au lieu de cela, il vous suffit de faire glisser et déposer des images de référence pour définir trois éléments clés : le sujet, la scène et le style. Cette approche visuelle avant tout est amusante et originale.

“Nous l’avons créé pour une exploration visuelle rapide, pas pour des retouches pixel parfaites”, explique Google dans leur annonce. L’outil utilise les capacités de compréhension visuelle de Gemini pour générer automatiquement des légendes détaillées des images fournies par l’utilisateur, qui alimentent ensuite Imagen 3 pour créer de nouvelles variations.

Les premiers tests avec des artistes et des créatifs suggèrent que Whisk comble un créneau unique dans le flux de travail créatif. Plutôt que de fonctionner comme un éditeur d’images traditionnel, il sert d’outil d’idéation rapide, permettant aux utilisateurs d’explorer rapidement des variations de concepts pour des produits tels que des peluches digitales, des épingles émaillées et des autocollants.

Bien sûr, étant donné que Whisk extrait uniquement certaines caractéristiques des images de référence, les résultats générés peuvent différer de vos attentes (ce qui fait en partie le plaisir). Cependant, Google vous fournit également l’instruction sous-jacente générée par Gemini afin que vous puissiez la modifier et apporter des ajustements si nécessaire.

Whisk est disponible exclusivement aux utilisateurs aux États-Unis via Google Labs, où il rejoint la gamme croissante d’outils IA expérimentaux de l’entreprise.

Source : www.maginative.com

  • mia dufresne portrait redactrice

    Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.

    Voir toutes les publications