Des robots apprennent à naviguer grâce à des vidéos: la révolution de DeepMind 🤖 #IA #Google #tech
Les robots de l’équipe de robotique de Google DeepMind apprennent à agir comme des stagiaires humains : en regardant une vidéo. L’équipe a publié un nouvel article démontrant comment les robots RT-2 de Google, équipés du modèle d’IA générative Gemini 1.5 Pro, peuvent absorber des informations à partir de vidéos pour apprendre à se déplacer et même à accomplir des tâches à leur destination.
Un modèle innovant d’IA pour l’apprentissage des robots
Grâce à la fenêtre contextuelle longue du modèle Gemini 1.5 Pro, il est possible de former un robot comme un nouveau stagiaire. Cette fenêtre permet à l’IA de traiter simultanément des quantités importantes d’informations. Les chercheurs filment une visite vidéo d’une zone désignée, comme un domicile ou un bureau. Ensuite, le robot regarde la vidéo et se familiarise avec l’environnement.
Les détails dans les visites vidéo permettent au robot d’accomplir des tâches en se basant sur ses connaissances apprises, en utilisant à la fois des sorties verbales et visuelles. C’est une façon impressionnante de montrer comment les robots pourraient interagir avec leur environnement de manière semblable au comportement humain.
Expertise en IA robotique
Ces démonstrations ne sont pas des cas isolés. Dans des tests pratiques, les robots alimentés par Gemini ont opéré dans une zone de 9 000 pieds carrés et ont suivi avec succès plus de 50 instructions d’utilisateurs différentes avec un taux de réussite de 90 %. Cette précision élevée ouvre de nombreuses applications potentielles dans le monde réel pour les robots alimentés par l’IA, que ce soit pour aider à la maison avec les tâches ménagères ou au travail avec des tâches simples ou même plus complexes.
L’une des caractéristiques les plus remarquables du modèle Gemini 1.5 Pro est sa capacité à réaliser des tâches en plusieurs étapes. Les recherches de DeepMind ont montré que les robots peuvent déterminer comment répondre à des questions telles que la disponibilité d’une boisson spécifique en se rendant à un réfrigérateur, en traitant visuellement son contenu, puis en répondant à la question.
L’avenir de l’IA dans le domaine de la robotique
L’intégration de modèles d’IA comme Gemini 1.5 Pro dans la robotique marque une avancée majeure dans le domaine. Les robots équipés de modèles comme Gemini ou ses concurrents pourraient transformer les secteurs de la santé, de la logistique et même des tâches d’entretien.
Source : www.techradar.com