DeepSeek a révélé aujourd'hui certaines données sur les coûts et les revenus liés aux modèles populaires V3 et R1, affirmant un rapport coût/rendement théorique allant jusqu'à 545 % par jour, malgré les avertissements selon lesquels les revenus réels pourraient être inférieurs.
C'est la première fois que la start-up chinoise d'IA divulgue des informations sur ses marges bénéficiaires issues de tâches « d'inférence » moins exigeantes en termes de calcul, l'étape post-formation qui implique que des modèles d'IA formés font des prédictions ou exécutent des tâches, par exemple via des chatbots.
Le retour sur investissement théorique revendiqué par DeepSeek est de 545 %.
La divulgation de la société basée à Hangzhou pourrait encore plus bouleverser le marché boursier de l'IA en dehors de la Chine, qui a plongé en janvier après que les chatbots Web et d'applications alimentés par les modèles R1 et V3 de la société ont gagné en popularité dans le monde entier.
La chute des actions du secteur de l'IA est en partie due aux allégations selon lesquelles DeepSeek aurait dépensé moins de 6 millions de dollars en puces utilisées pour former ses modèles, soit bien moins que ce que dépensent ses rivaux américains comme OpenAI.
Les puces que DeepSeek prétend avoir utilisées, les H800 de Nvidia, sont également bien moins puissantes que celles auxquelles OpenAI et d'autres sociétés d'IA américaines ont accès, ce qui rend les investisseurs encore plus sceptiques quant aux promesses des sociétés d'IA américaines de dépenser des milliards sur des puces avancées.
En supposant que le coût de location d'une puce H800 soit de 2 $ par heure, le coût total d'inférence quotidien pour ses modèles V3 et R1 est de 87 072 $, a déclaré DeepSeek dans un article GitHub publié samedi. En revanche, le revenu quotidien théorique généré par ces modèles est de 562 027 $, ce qui se traduit par un retour sur investissement de 545 %. Sur un an, cela représenterait plus de 200 millions de dollars de revenus.
Cependant, la société a ajouté que ses « revenus réels sont nettement inférieurs » car le coût d'utilisation de son modèle V3 est inférieur à celui du modèle R1, seuls certains services sont monétisés car l'accès au Web et aux applications reste gratuit et les développeurs paient moins pendant les heures creuses.
Selon le Wall Street Journal, les responsables chinois ont demandé aux meilleurs chercheurs et entrepreneurs en intelligence artificielle (IA) du pays d'éviter les voyages d'affaires aux États-Unis. Le journal indique que les autorités chinoises craignent que les experts en IA voyageant à l'étranger puissent révéler des informations confidentielles sur les développements technologiques du pays.
Les autorités chinoises craignent également que des cadres en déplacement professionnel puissent être détenus et utilisés comme monnaie d'échange dans les négociations entre les États-Unis et la Chine, rappelant l'arrestation d'un cadre de Huawei au Canada à la demande de Washington pendant le premier mandat du président américain Donald Trump.
Selon la source, les dirigeants des entreprises chinoises d'IA qui partent en voyage d'affaires doivent signaler leurs projets aux autorités avant de partir et, à leur retour, donner un compte rendu détaillé de ce qu'ils ont fait et des personnes qu'ils ont rencontrées.
Source : https://www.baogiaothong.vn/deepseek-tiet-lo-loi-nhuan-khung-tu-cac-mo-hinh-ai-192250301220905413.htm
Comment (0)