Nvidia a joué un rôle central dans l'essor de l'IA l'année dernière avec ses coûteuses unités de traitement graphique (GPU) pour serveur, dont le H100. Ils sont essentiels pour la formation et le déploiement d'une IA générative comme ChatGPT d'OpenAI.
Ne s'arrêtant pas là, Nvidia continue de démontrer sa force dans le segment des GPU grand public avec l'annonce de trois nouvelles cartes graphiques au CES 2024 : RTX 4060 Super, RTX 4070 Ti Super et RTX 4080 Super, au prix de 599 $ jusqu'à 999 USD. Ils disposent de « cœurs tenseurs » supplémentaires, conçus pour exécuter des applications d’IA génératives. De plus, Nvidia fournit également des cartes graphiques dans les ordinateurs portables d'Acer, Dell, Lenovo...
La demande pour les GPU d'entreprise de Nvidia, qui coûtent des dizaines de milliers de dollars par puce et sont généralement utilisés dans des systèmes de huit GPU, a aidé l'entreprise à afficher de fortes ventes, portant sa capitalisation boursière à plus de 1 000 milliards de dollars.
Les GPU pour PC ont longtemps été la source de revenus de Nvidia, utilisés pour jouer à des jeux vidéo. Cependant, la société affirme que les cartes graphiques de cette année ont été améliorées et sont conçues pour exécuter des modèles d'IA sans renvoyer d'informations au cloud. Par exemple, la puce RTX 4080 peut générer des vidéos AI 150 % plus rapidement que son prédécesseur. D’autres améliorations logicielles rendent le traitement de grands modèles linguistiques 5 fois plus rapide.
Justin Walker, directeur principal de la gestion des produits chez Nvidia, a déclaré que la société avait vendu 100 millions de GPU RTX. Nvidia espère que les applications d’IA à venir l’année prochaine tireront parti des nouveaux GPU. Microsoft devrait annoncer Windows 12, la nouvelle version de Windows, plus tard cette année.
La nouvelle puce de Nvidia pourrait être utilisée pour créer des images dans l'outil Firefly d'Adobe Photoshop ou supprimer des arrière-plans lors d'appels vidéo. Nvidia développe également des outils permettant aux développeurs de jeux d’intégrer l’IA générative dans leurs jeux.
Selon CNBC, les puces montrent que même si Nvidia est toujours principalement attaché aux GPU pour serveurs, la société sera en concurrence avec Intel, AMD et Qualcomm dans le segment de l'IA locale. Les trois concurrents ont annoncé de nouvelles puces destinées à être utilisées dans les « PC IA ». L’industrie technologique cherche à déterminer la meilleure façon d’appliquer l’IA générative, qui nécessite une puissance de calcul massive et dont l’exécution dans le cloud est coûteuse.
Une solution technique promue par les concurrents de Microsoft et de Nvidia s'appelle « AI PC » ou parfois « edge computing ». Au lieu d'utiliser de puissants superordinateurs via Internet, les appareils auront des puces d'IA plus puissantes à l'intérieur et pourront exécuter de grands modèles linguistiques ou des applications d'images créatives, bien sûr sans aucune lacune.
Les nouvelles cartes graphiques seront conformes aux restrictions d’exportation américaines et pourraient être vendues en Chine. Il s’agit d’une alternative pour les chercheurs et les entreprises chinoises qui ne peuvent pas se permettre les GPU de serveur les plus puissants de Nvidia.
(Selon CNBC)
Source
Comment (0)