Les grands noms du domaine de l'intelligence artificielle (IA) reconnaissent les réalisations de la startup chinoise DeepSeek, mais affirment que le succès de l'entreprise ne doit pas être exagéré.
Du PDG d'OpenAI, Sam Altman, au scientifique de Google, Andrew Ng, les esprits les plus brillants de l'IA au monde apprécient l'approche open source de DeepSeek après que la startup chinoise a lancé deux modèles d'IA de pointe.
L'entreprise basée à Hangzhou a surpris l'industrie mondiale de l'IA avec son modèle de raisonnement open source R1.
Lancé le 20 janvier, le modèle présente des performances comparables aux modèles à source fermée d'OpenAI – le développeur de ChatGPT – mais les coûts de formation seraient bien inférieurs.
DeepSeek V3 – le modèle de langage fondamental à grande échelle – a été publié il y a quelques semaines et sa formation n'a coûté que 5,5 millions de dollars, selon DeepSeek.
L'annonce de la société a soulevé des questions quant à savoir si les entreprises technologiques dépensaient trop d'argent en puces graphiques (GPU) pour la formation de l'IA, ce qui a conduit à une liquidation des actions technologiques concernées.
La semaine dernière, dans une question « Demandez-moi n’importe quoi » sur Reddit, Altman a soutenu qu’OpenAI avait tort et qu’il devait trouver une approche différente de l’open source.
L'entreprise a toujours adopté une approche fermée, gardant secrets des détails tels que les méthodes de formation spécifiques et les coûts énergétiques de ses modèles.
« Cela dit, tout le monde chez OpenAI ne partage pas ce point de vue » et « ce n’est pas notre priorité absolue à l’heure actuelle », a admis le PDG d’OpenAI.
Andrew Ng, fondateur de Google Brain et ancien scientifique en chef de Baidu, a déclaré que les produits de DeepSeek et de ses compatriotes montrent que la Chine rattrape rapidement les États-Unis en matière d'IA.
« Lorsque ChatGPT a été lancé en novembre 2022, les États-Unis étaient nettement en avance sur la Chine en matière d’IA générative… mais en fait, cet écart s’est rapidement réduit au cours des deux dernières années », a-t-il écrit sur X. « Avec des modèles chinois comme Qwen, Kimi, InternVL et DeepSeek, la Chine comble clairement son retard et dans des domaines comme la création vidéo, il y a eu des moments où la Chine semblait être en avance.
Le modèle Qwen a été développé par Alibaba, tandis que Kimi et InternVL sont des produits de la startup Moonshot AI et du Shanghai AI Lab.
Si les États-Unis continuent de bloquer l'open source, la Chine dominera cette partie de la chaîne d'approvisionnement et de nombreuses entreprises finiront par adopter des modèles qui reflètent davantage les valeurs chinoises que celles américaines, selon M. Ng.
Un certain nombre d’entreprises américaines cherchent à appliquer le modèle de DeepSeek à leurs produits. Par exemple, les utilisateurs du service NIM de Nvidia peuvent accéder au modèle R1 depuis la semaine dernière, et Microsoft prend également en charge R1 sur sa plateforme cloud Azure et GitHub. Amazon permet aux clients de créer des applications en utilisant R1 via AWS.
Cependant, certains experts affirment également que le succès de DeepSeek ne doit pas être exagéré. Yann LeCun, responsable scientifique de l'IA chez Meta, estime que l'idée selon laquelle « la Chine dépassera les États-Unis en matière d'IA » grâce à DeepSeek est fausse.
Au contraire, « les modèles open source surpassent les modèles propriétaires », a-t-il écrit sur Threads.
DeepSeek, une startup issue du fonds spéculatif High-Flyer du fondateur Liang Wenfeng en mai 2023, fait toujours face au scepticisme quant à ses coûts réels et à ses méthodes de formation des modèles d'IA.
Zheng Xiaoqing, professeur d'informatique à l'université de Fudan, a souligné que le coût de la formation de DeepSeek V3 n'inclut pas les coûts liés aux tests et à la recherche, selon le rapport technique de la startup.
Le succès de DeepSeek vient de « l'optimisation technique », a-t-il déclaré, donc cela n'a pas d'impact majeur sur l'approvisionnement ou les expéditions de puces.
(Selon SCMP)
Source : https://vietnamnet.vn/nhung-ten-tuoi-ai-hang-dau-the-gioi-tranh-luan-ve-deepseek-2368357.html
Comment (0)