5 juillet 2024

Krusell France

Ta dose d'actu digital !

Voici le titre d’article optimal : “Google Vision: Solutions aux problèmes de blocage d’images et de taille de fichier”

Google “gemini-pro-vision” model suddenly shifts to Chinese | by alex buzunov | Jun, 2024
Rate this post

Optimisation des images avec Google Vision : Comment éviter les blocages

Les images peuvent parfois être bloquées, voici l’exemple d’une image et du message d’erreur associé :

Solution : En cas d’erreur, il est important de vérifier si la réponse contient un `Part` valide. Pour cela, il est recommandé de consulter les `safety_ratings` du candidat pour déterminer si la réponse a été bloquée.

Évaluation des risques : Il est essentiel de prendre en compte la raison du blocage, qu’elle soit “OTHER” ou autre. De plus, il est important de vérifier les `candidates` de la réponse, et le cas échéant, consulter les éventuelles `safety_ratings`. En l’absence de candidats dans la réponse, il est possible que celle-ci ait été bloquée pour d’autres raisons.

Intégration de modèles Google Vision pour fusionner les descriptions d’images

Le modèle gemini-pro-vision permet de fusionner les descriptions de plusieurs images en une seule :

Le premier modèle propose une femme en robe bleue marchant à travers des rideaux jaunes et bleus, une autre en tenue bleue et jaune tenant une arme dans un champ de blé, une troisième en robe rouge assise sur une balançoire face à un fond rose, et ainsi de suite pour dix images différentes.

Le second modèle gemini-1.5-pro-latest offre une fusion créative des descriptions d’images, telles que des chatons, un guerrier et une capture d’écran d’un film d’horreur, combinant des éléments surréalistes et inattendus.

Une fusion décalée entre chaos et mignonnerie, entre cris et miaulements, entre guerriers et ballons en forme de coeur, le modèle offre une réponse créative et hors du commun.

Limite de taille des images et gestion des erreurs

Lorsque la taille des images dépasse la limite autorisée, des problèmes peuvent survenir. Il est primordial de veiller à ce que le payload ne dépasse pas les 20 mégaoctets, au risque de rencontrer des erreurs de type “Request payload size exceeds the limit”.

Si une demande de description d’une scène d’horreur est formulée, il est important de respecter les principes éthiques du modèle, qui refuse de glorifier la violence et la guerre. Au lieu de cela, des thèmes positifs comme la résilience, l’espoir et la paix sont encouragés pour des conversations constructives.

Source : medium.com

  • Mia Dufresne

    Mia est une rédactrice spécialisée dans les produits tech et l'IA, avec une formation en data science et une passion pour l'innovation. Elle explore les dernières avancées en IA, leurs applications pratiques et leurs implications éthiques.

    Voir toutes les publications