Découvrez les différences entre DeepSeek et Qwen2.5 dans le secteur de l’IA

Les récentes avancées des plateformes d’intelligence artificielle DeepSeek et Qwen d’Alibaba sont un sujet très discuté parmi les experts en technologie et les investisseurs en Chine et aux États-Unis. Cependant, les informations spécifiques sur les équipes d’ingénierie chinoises restent rares. Une analyse d’Asia Times utilisant des informations publiques sur les antécédents des développeurs des deux chatbots peut aider à tracer un tableau plus clair de l’émergence de DeepSeek et Qwen. Basés sur des articles de recherche et des rapports médiatiques disponibles publiquement, les équipes d’ingénierie de DeepSeek et Qwen ne collaborent pas ou ne se chevauchent pas. La seule connexion entre le duo est que les chercheurs de DeepSeek ont déclaré dans un article daté du 22 janvier de cette année qu’ils avaient “distillé” Qwen2.5, ainsi que le Llama de Meta, pour développer DeepSeek-R1. Le lancement de DeepSeek-R1 a provoqué une baisse du marché boursier américain fin janvier. Certains analystes pensent que DeepSeek, une IA open source, a peut-être également utilisé une “distillation des connaissances” pour extraire des données du ChatGPT d’OpenAI et entraîner ses modèles d’IA. Cependant, aucune preuve concluante n’a été rendue publique à ce sujet. Selon l’article du 22 janvier, DeepSeek-R1 compte 16 contributeurs principaux, dont certains ont des liens directs avec Microsoft Research Asia (MSRA) et la China Computer Federation (CCF). Yu Wu, contributeur principal, a été supervisé par Ming Zhou du MSRA pendant son programme de doctorat à l’Université de Beihang de 2014 à 2019. Il a été stagiaire à temps plein au MSRA de 2013 à 2019 avant de rejoindre le poste de chercheur associé en 2019. Daya Guo, autre contributeur principal, a également été supervisé par Ming Zhou pendant son programme de doctorat à l’Université Sun Yat-sen de Guangzhou de 2018 à 2023. Il a été encadré par Nan Duan en 2020-2023 et par Duyu Tang en 2017-2020 au sein du Natural Language Computing Group du MSRA. Zhibin Gou et Zhihong Shao, tous deux de l’Université Tsinghua, ont co-écrit des articles avec Nan Duan du MSRA. Zhenda Xie, un autre contributeur de DeepSeek, a été conseillé par le scientifique distingué du MSRA, Baining Guo, à l’Université Tsinghua de 2018 à 2023. Il a également travaillé en tant que stagiaire de recherche au MSRA pendant la même période. Ming Zhou et Nan Duan travaillent toujours pour le MSRA. En 2016 et 2018, ils ont conjointement dirigé le Computer Terminology Approval Working Committee de la CCF. Zhou est maintenant vice-président de la CCF. Le lien entre l’équipe de DeepSeek et les chercheurs du MSRA ne signifie évidemment pas que le MSRA a des parts dans l’entreprise basée à Hangzhou. Cependant, si les États-Unis exerçaient davantage de pression sur le secteur technologique chinois, le MSRA pourrait être contraint de cesser ses programmes de travail et de stage en Chine. Au début de 2023, le MSRA aurait apparemment cessé de recruter des stagiaires dans sept universités chinoises et à l’Université de Postes et Télécommunications de Beijing en raison de préoccupations concernant leurs liens avec l’Armée populaire de libération. L’Université Polytechnique du Nord-Ouest (NPU) et l’Institut de Technologie de Harbin (HIT), sanctionnés par les États-Unis, font partie de ces écoles. DAMO Academy Le géant chinois Alibaba, fondé par Jack Ma, a développé son chatbot de manière différente. Alibaba, mobilisant les flux de trésorerie de ses activités de commerce électronique, a créé l’Académie DAMO en 2017 pour entreprendre des recherches en intelligence artificielle. DAMO signifie Discovery, Adventure, Momentum et Outlook. L’académie a mis en place un comité consultatif de 10 éducateurs et chercheurs de renom, dont six des États-Unis et quatre des universités chinoises. Alibaba a désigné Jingren Zhou, Chief Technology Officer d’Aliyun, pour diriger l’Académie DAMO. Zhou a obtenu son doctorat en informatique de l’Université de Columbia aux États-Unis. Il a été partenaire de recherche et développement chez Microsoft pendant quatre ans avant de rejoindre Alibaba en juillet 2016. Chang Zhou, ingénieur en algorithmes responsable du traitement des données de Qwen, a rejoint l’Académie DAMO en 2017. Diplômé de l’Université Fudan en 2012, il a obtenu son doctorat à l’Université de Pékin en 2017. Avant de rejoindre Alibaba, il avait déjà travaillé avec des ingénieurs logiciels d’Alibaba sur certains projets et co-écrit deux articles avec eux en 2017. Jun Gao, professeur à l’Université de Pékin, qui était apparemment le superviseur de Chang Zhou, figurait parmi les co-auteurs. Gao a obtenu son doctorat de l’Université de Pékin en 2003 et a publié plus de 30 articles de recherche. Il a des projets financés par le Programme 863 de la Chine et la Fondation Nationale des Sciences Naturelles de Chine. En mars 1986, 200 scientifiques chinois de premier plan ont proposé le Programme 863 au dirigeant chinois de l’époque, Deng Xiaoping. Le gouvernement a mis en place le programme en novembre de la même année. En 2022, Chang Zhou a co-écrit un article de recherche avec un groupe d’académiciens, dont Bin Cui de l’Université de Pékin, qui a également dirigé certains projets financés par le Programme 863. Cui est actuellement doyen adjoint de l’École d’informatique de l’Université de Pékin et le directeur adjoint du Comité Technique sur les Bases de Données de la CCF. En juillet dernier, Chang Zhou a décidé d’emmener avec lui une équipe d’une dizaine d’ingénieurs pour rejoindre ByteDance. Alibaba aurait intenté un procès contre Zhou, arguant qu’il n’avait pas le droit de rejoindre un concurrent. Qwen vs DeepSeek L’équipe de recherche d’Alibaba semble avoir un comité consultatif plus solide que DeepSeek. Elle possède également une histoire plus longue dans la recherche en gestion des données. C’est peut-être pour cette raison qu’Alibaba a pu développer Qwen2.5, un modèle d’IA original, tandis que DeepSeek n’a réussi qu’à élaborer des versions distillées d’autres modèles d’IA. C’est aussi probablement pour cette raison qu’Apple Inc. s’est récemment associé à Alibaba pour lancer des iPhones alimentés par l’IA. La chroniqueuse IT Amanda Caswell a écrit dans un article récent que Qwen2.5 surpasse Deep-R1 dans les sept tests qu’elle a réalisés. Elle affirme que Qwen2.5 offre des réponses plus structurées et lisibles, tandis que les réponses de DeepSeek-R1 manquent de profondeur et d’originalité. Du point de vue de Pékin, à la fois Qwen et DeepSeek sont tout aussi essentiels car ils aident la Chine à moderniser son industrie et à se prémunir contre le découplage et les sanctions américains. Des rapports médiatiques ont indiqué que le président chinois Xi Jinping présidera bientôt une symposium visant à renforcer le sentiment du secteur privé. Le co-fondateur d’Alibaba, Jack Ma, et le fondateur de DeepSeek, Liang Wenfeng, y assisteront.
Source : asiatimes.com