AIは本当に考えることができるのか？

OpenAI のチャットボットは、新しいテクノロジーを通じて常に改善されています。写真:ニューヨークタイムズ。

2024年9月、OpenAIは、数学、科学、コンピュータープログラミングに関連するタスクを推論できるo1モデルを統合したChatGPTのバージョンをリリースしました。

ChatGPT の以前のバージョンとは異なり、新しいテクノロジーでは、応答する前に複雑な問題に対する解決策について「考える」のに時間がかかります。

OpenAIに続いて、Google、Anthropic、DeepSeekなどの多くの競合他社も同様の推論モデルを導入しました。完璧ではありませんが、これは多くの開発者が信頼するチャットボットのアップグレード技術です。

AIの推論方法

基本的に、推論とは、チャットボットがユーザーから提示された問題の解決に多くの時間を費やすことができることを意味します。

「推論とは、システムが質問を受けた後にさらに作業を進める仕組みだ」とカリフォルニア大学バークレー校のコンピューターサイエンス教授ダン・クライン氏はニューヨーク・タイムズ紙に語った。

推論システムは、問題を個々のステップに分解したり、試行錯誤を通じて解決したりすることができます。

ChatGPT は、最初にリリースされたとき、情報を抽出して統合することで質問に即座に回答することができました。一方、推論システムは問題を解決して応答するのにさらに数秒（または数分）かかります。

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 1

カスタマーケアチャットボットにおける O1 モデルの推論プロセスの例。写真: OpenAI .

場合によっては、推論システムが問題へのアプローチを変更し、解決策を継続的に改善します。さらに、モデルは最適な選択を行う前に複数のソリューションをテストしたり、以前の応答の精度を確認したりすることもできます。

一般に、推論システムは質問に答えるために考えられるすべての方法を検討します。これは、小学生が数学の問題を解くのに最も適した方法を選択する前に、紙に多くの選択肢を書き出すようなものです。

ニューヨークタイムズによると、AIは現在、あらゆるトピックについて推論できるようになっている。ただし、このタスクは、数学、科学、コンピュータープログラミングに関連する質問で最も効果的です。

理論システムはどのように訓練されるのでしょうか?

通常のチャットボットでも、ユーザーはプロセスの説明を求めたり、応答の正確さを確認したりできます。実際、多くの ChatGPT トレーニングデータセットには、すでに問題解決手順が含まれています。

ユーザーが要求しなくても操作を実行できる場合、推論システムはさらに高度になります。このプロセスはより複雑で広範囲にわたります。企業が「推論」という言葉を使うのは、システムが人間の思考方法と同様に機能するためです。

OpenAI のような多くの企業は、推論システムが今日のチャットボットを改善するための最善のソリューションになると考えています。長年、チャットボットはインターネット上のできるだけ多くの情報からトレーニングすればより効果的に機能すると信じられてきました。

2024 年までに、AI システムはインターネット上で利用可能なほぼすべてのテキストを処理することになります。つまり、企業は推論システムを含むチャットボットをアップグレードするための新しいソリューションを見つける必要があるということです。

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 2

スタートアップ企業のDeepSeekはかつて、OpenAIよりも低コストの推論モデルで「話題を呼んだ」ことがある。写真：ブルームバーグ。

昨年以来、OpenAIなどの企業は強化学習技術に注力してきました。このプロセスには通常数か月かかり、その間に AI は試行錯誤を通じて動作を学習します。

たとえば、何千もの問題を解くことで、システムは正しい答えを出す最適な方法を学習できます。そこから研究者たちは、システムが正しい解決策と間違った解決策を認識するのに役立つ複雑なフィードバックメカニズムを構築しました。

「犬の訓練に似ています。うまくいけばご褒美を与えます。うまくいかなければ、『あの犬は悪い犬だ』と言います」とオープンAIの研究者であるジェリー・トゥオレク氏は語った。

AIは未来か？

New York Timesによると、強化学習技術は数学、科学、コンピュータープログラミングの要件に適しています。これは、明確な正解または不正解がある領域です。

対照的に、強化学習は、善と悪を区別することが難しい創造的な執筆、哲学、倫理などの分野では効果がありません。それでも研究者たちは、この技術は数学以外の問題でもAIのパフォーマンスを向上させることができると主張している。

「システムは、良い結果と悪い結果につながる道筋を学習するだろう」と、アントロピックの最高科学責任者、ジャレッド・カプラン氏は言う。

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 3

AIモデル「クロード」を所有するスタートアップ企業、Anthropicのウェブサイト。写真：ブルームバーグ。

強化学習と推論システムは 2 つの異なる概念であることに注意することが重要です。具体的には、強化学習は理論的なシステムを構築する手法です。これは、チャットボットが推論できるようになるための最終トレーニング段階です。

まだ比較的新しいため、科学者たちは推論チャットボットや強化学習が AI が人間のように考えるのに役立つかどうかまだ確信が持てません。現在の AI トレーニングのトレンドの多くは、最初は急速に成長し、その後は減速する傾向にあることは注目に値します。

さらに、推論チャットボットでも間違いを犯す可能性があります。システムは、確率に基づいて、インターネットから取得されたものであれ、強化学習を通じて取得されたものであれ、学習したデータに最も近いプロセスを選択します。したがって、チャットボットは依然として間違った解決策や不合理な解決策を選択する可能性があります。

出典: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html