Les dernières avancées en IA par TikTok, Meta, Google DeepMind, Notion, Runway, Hedra, ElevenLabs et Nvidia.
Les dernières avancées en matière d’Intelligence Artificielle
Les entreprises telles que TikTok, Meta, Google DeepMind, Notion, Runway, Hedra, ElevenLabs et Nvidia ont réalisé d’importants progrès dans le domaine de l’Intelligence Artificielle.
Partenariat entre OpenAI et Color Health
OpenAI et Color Health ont annoncé une collaboration pour créer un assistant d’IA dédié aux soins personnalisés du cancer. Cet assistant, utilisant GPT-4, analyse les données des patients, les directives et les dossiers médicaux pour identifier les lacunes dans le dépistage et élaborer des plans personnalisés.
Les nouveautés de TikTok
TikTok a lancé Symphony, une nouvelle suite de fonctionnalités d’IA comprenant des avatars numériques, des outils de traduction et un assistant d’IA. Les marques peuvent choisir parmi des “avatars standard” basés sur de vrais acteurs ou créer des avatars personnalisés en tant que représentants virtuels de la marque.
L’outil “Global Translate” de TikTok
Cet outil de doublage d’IA peut automatiquement transcrire, traduire et doubler des vidéos dans plus de dix langues, aidant ainsi les marques à étendre leur contenu à l’échelle mondiale.
Les nouvelles technologies de Meta
L’équipe FAIR de Meta a dévoilé une série de nouveaux modèles et technologies d’IA open-source, notamment des tâches de langage multimodal, du texte vers la musique et l’audio, et la détection de synthèse vocale.
La plateforme Notion et ses connecteurs d’IA
Notion a introduit des connecteurs d’IA qui relient Slack et Google Drive à Notion, améliorant considérablement le flux de travail pour les utilisateurs de Notion et Slack.
Le modèle Gen-3 Alpha de Runway
Ce modèle d’IA peut générer des clips vidéo réalistes de 10 secondes à partir de prompts textuels et d’images. Des modèles publics de KLING, Luma et Runway sont déjà disponibles, et ceux de Sora d’OpenAI et de Veo de Google arriveront bientôt.
Le modèle Character-1 de Hedra
Ce nouveau modèle fondamental peut transformer des images en vidéos de portrait caractéristiques, prétendant durer indéfiniment (la prévisualisation publique dure jusqu’à 30 secondes).
Les nouvelles applications et API d’ElevenLabs
La société a lancé de nouvelles applications open-source de texte et audio vidéo et une API, permettant aux utilisateurs de générer de l’audio à partir de prompts textuels ou de vidéos, et aux développeurs de construire des applications utilisant cette technologie.
Nvidia devient la société la plus valorisée au monde.
Source : medium.com