Lors du boom de l'IA de l'année dernière, Nvidia a joué un rôle central avec ses coûteuses unités de traitement graphique (GPU) pour serveur, notamment le H100. Ils sont essentiels pour la formation et le déploiement d'une IA générative comme ChatGPT d'OpenAI.

6drwduph.png
Nvidia annonce une gamme d'ordinateurs portables « prêts pour l'IA » équipés de sa nouvelle gamme de GPU Super. (Photo : Nvidia)

Ne s'arrêtant pas là, Nvidia continue de démontrer sa force dans le segment des GPU grand public avec l'annonce de trois nouvelles cartes graphiques au CES 2024 : RTX 4060 Super, RTX 4070 Ti Super et RTX 4080 Super, dont les prix varient de 599 $ à 999 $. Ils disposent de « cœurs tenseurs » supplémentaires, conçus pour exécuter des applications d’IA génératives. De plus, Nvidia fournit également des cartes graphiques dans les ordinateurs portables d'Acer, Dell, Lenovo...

La demande pour les GPU d'entreprise de Nvidia - qui coûtent des dizaines de milliers de dollars par puce et sont généralement utilisés dans des systèmes de huit GPU - a aidé l'entreprise à enregistrer de fortes ventes, portant sa capitalisation boursière à plus de 1 000 milliards de dollars.

Les GPU pour PC sont depuis longtemps la source de revenus de Nvidia, utilisés pour jouer à des jeux vidéo. Néanmoins, la société affirme que les cartes graphiques de cette année ont été améliorées et sont conçues pour exécuter des modèles d'IA sans renvoyer d'informations vers le cloud. Par exemple, la puce RTX 4080 peut générer des vidéos IA 150 % plus rapidement que son prédécesseur. D’autres améliorations logicielles rendent le traitement des grands modèles linguistiques 5 fois plus rapide.

Justin Walker, directeur principal de la gestion des produits chez Nvidia, a déclaré que la société avait vendu 100 millions de GPU RTX. Nvidia espère que les applications d’IA à venir l’année prochaine tireront parti des nouveaux GPU. Microsoft devrait annoncer Windows 12, la nouvelle version de Windows, plus tard cette année.

La nouvelle puce de Nvidia pourrait être utilisée pour créer des images dans l'outil Firefly d'Adobe Photoshop ou supprimer des arrière-plans lors d'appels vidéo. Nvidia développe également des outils permettant aux développeurs de jeux d’intégrer l’IA générative dans leurs jeux.

Selon CNBC, les puces montrent que même si Nvidia est toujours plus attaché aux GPU de serveur, la société sera en concurrence avec Intel, AMD et Qualcomm dans le segment de l'IA locale. Les trois concurrents ont annoncé de nouvelles puces destinées à être utilisées dans les « PC IA ». L’industrie technologique cherche à déterminer la meilleure façon d’appliquer l’IA générative, qui nécessite une puissance de calcul massive et dont l’exécution dans le cloud est coûteuse.

Une solution technique promue par les concurrents de Microsoft et de Nvidia est appelée « AI PC », ou parfois appelée « edge computing ». Au lieu d'utiliser de puissants superordinateurs via Internet, les appareils auront des puces d'IA plus puissantes à l'intérieur et pourront exécuter de grands modèles linguistiques ou des applications d'images créatives, bien sûr sans aucune lacune.

Les nouvelles cartes graphiques seront conformes aux restrictions d’exportation américaines et pourraient être vendues en Chine. Il s’agit d’une alternative pour les chercheurs et les entreprises chinois qui ne peuvent pas se permettre les GPU de serveur les plus puissants de Nvidia.

(Selon CNBC)