Vietnam.vn - Nền tảng quảng bá Việt Nam

L’IA peut-elle vraiment penser ?

Des entreprises comme OpenAI et DeepSeek font la promotion de chatbots de raisonnement, qui peuvent être plus performants dans certaines tâches de calcul.

Zing NewsZing News06/04/2025

Le chatbot d'OpenAI s'améliore constamment grâce aux nouvelles technologies. Photo : New York Times .

En septembre 2024, OpenAI a publié une version de ChatGPT qui intègre le modèle o1, qui peut raisonner sur des tâches liées aux mathématiques, aux sciences et à la programmation informatique.

Contrairement à la version précédente de ChatGPT, la nouvelle technologie prendra le temps de « réfléchir » aux solutions à des problèmes complexes avant de donner une réponse.

Après OpenAI, de nombreux concurrents tels que Google, Anthropic et DeepSeek ont ​​également introduit des modèles de raisonnement similaires. Bien qu'elle ne soit pas parfaite, il s'agit toujours d'une technologie de mise à niveau de chatbot à laquelle de nombreux développeurs font confiance.

Comment l'IA raisonne

Fondamentalement, le raisonnement signifie que le chatbot peut passer plus de temps à résoudre le problème présenté par l’utilisateur.

« Le raisonnement est la façon dont le système fait plus de travail après avoir reçu une question », a déclaré Dan Klein, professeur d’informatique à l’Université de Californie à Berkeley, au New York Times .

Le système de raisonnement peut décomposer un problème en étapes individuelles ou le résoudre par essais et erreurs.

Lors de son lancement, ChatGPT pouvait répondre instantanément aux questions en extrayant et en synthétisant les informations. Pendant ce temps, le système de raisonnement a besoin de quelques secondes (voire minutes) supplémentaires pour résoudre le problème et répondre.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 1

Exemple de processus de raisonnement du modèle o1 dans le chatbot de service client. Photo : OpenAI .

Dans certains cas, le système de raisonnement changera son approche du problème, améliorant continuellement la solution. De plus, le modèle peut tester plusieurs solutions avant de faire un choix optimal ou vérifier l’exactitude des réponses précédentes.

En général, le système de raisonnement considérera toutes les manières possibles de répondre à la question. C'est comme les élèves de l'école primaire, qui écrivent de nombreuses options sur papier avant de choisir la manière la plus appropriée de résoudre un problème mathématique.

Selon le New York Times , l’IA est désormais capable de raisonner sur n’importe quel sujet. Cependant, la tâche sera plus efficace avec des questions liées aux mathématiques, aux sciences et à la programmation informatique.

Comment le système théorique est-il formé ?

Sur un chatbot classique, les utilisateurs peuvent toujours demander une explication d’un processus ou vérifier l’exactitude d’une réponse. En fait, de nombreux ensembles de données de formation ChatGPT incluent déjà une procédure de résolution de problèmes.

Le système de raisonnement est encore plus avancé lorsqu’il peut effectuer une opération sans que l’utilisateur ne le demande. Ce processus est plus complexe et plus étendu. Les entreprises utilisent le mot « raisonnement » parce que le système fonctionne de manière similaire à la façon dont les humains pensent.

De nombreuses entreprises comme OpenAI estiment que les systèmes de raisonnement sont la meilleure solution pour améliorer les chatbots aujourd’hui. Pendant des années, ils ont cru que les chatbots fonctionnaient mieux s’ils étaient formés à partir d’autant d’informations que possible sur Internet.

D’ici 2024, les systèmes d’IA auront consommé la quasi-totalité du texte disponible sur Internet. Cela signifie que les entreprises doivent trouver de nouvelles solutions pour mettre à niveau les chatbots, y compris les systèmes de raisonnement.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 2

La startup DeepSeek a un jour « provoqué la fièvre » avec un modèle de raisonnement qui coûtait moins cher qu'OpenAI. Photo : Bloomberg .

Depuis l’année dernière, des entreprises comme OpenAI se concentrent sur les techniques d’apprentissage par renforcement. Ce processus prend généralement plusieurs mois, au cours desquels l’IA apprend le comportement par essais et erreurs.

Par exemple, en résolvant des milliers de problèmes, le système peut apprendre la méthode optimale pour donner la bonne réponse. À partir de là, les chercheurs ont construit un mécanisme de rétroaction complexe qui aide le système à reconnaître les solutions correctes et incorrectes.

« C'est comme dresser un chien. Si ça marche, on lui donne une friandise. Si ça ne marche pas, on dit : "Ce chien est méchant" », explique Jerry Tworek, chercheur chez OpenAI.

L’IA est-elle l’avenir ?

Selon le New York Times , les techniques d’apprentissage par renforcement fonctionnent bien avec les exigences des mathématiques, des sciences et de la programmation informatique. Il s’agit d’un domaine dans lequel il existe une réponse claire, bonne ou mauvaise.

En revanche, l’apprentissage par renforcement n’est pas efficace dans l’écriture créative, la philosophie ou l’éthique, des domaines où il est difficile de faire la distinction entre le bien et le mal. Pourtant, les chercheurs affirment que la technique peut encore améliorer les performances de l’IA, même sur des questions au-delà des mathématiques.

« Les systèmes apprendront les chemins qui mènent à des résultats positifs et négatifs », a déclaré Jared Kaplan, directeur scientifique d’Anthropic.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 3

Site Web d'Anthropic, la startup propriétaire du modèle d'IA Claude. Photo : Bloomberg .

Il est important de noter que l’apprentissage par renforcement et les systèmes de raisonnement sont deux concepts différents. Plus précisément, l’apprentissage par renforcement est une méthode de construction d’un système théorique. Il s’agit de la dernière étape de formation pour que le chatbot soit capable de raisonner.

Parce que c'est encore relativement nouveau, les scientifiques ne peuvent pas encore être sûrs que les chatbots de raisonnement ou l'apprentissage par renforcement peuvent aider l'IA à penser comme les humains. Il convient de noter que de nombreuses tendances actuelles en matière de formation à l’IA se développent très rapidement au début, puis ralentissent.

De plus, les chatbots raisonnés peuvent toujours faire des erreurs. En fonction de la probabilité, le système choisira le processus qui ressemble le plus aux données apprises, qu’elles proviennent d’Internet ou de l’apprentissage par renforcement. Par conséquent, le chatbot peut toujours choisir une solution erronée ou déraisonnable.

Source : https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html


Comment (0)

No data
No data

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit