画期的な研究によりAI推論の「ブラックボックス」が明らかに

Anthropic の CEO である Dario Amodei 氏が、同社の最新の研究成果を紹介します。写真:フォーチュン。

AI企業アンスロピックの研究者らは、大規模言語モデル（LLM）がどのように機能するかを正確に理解する上で根本的な進歩を遂げたと述べている。この画期的な進歩は、将来の AI モデルの安全性とセキュリティの向上に重要な意味を持ちます。

研究によれば、AI モデルは私たちが考えていたよりもさらに賢いことがわかっています。 ChatGPT、Gemini、Copilot などの最も強力なチャットボットの背後にある LLM モデルの最大の問題の 1 つは、それらがブラックボックスとして機能することです。

チャットボットに入力して結果を得ることはできるが、チャットボットがどのようにして特定の答えを導き出すのかは、チャットボットを作成した研究者にとっても謎のままである。

これにより、モデルがいつ幻覚を起こしたり誤った結果を生み出したりするかを予測することが難しくなります。研究者らは、AIが危険な質問に答えるのを防ぐ柵も構築したが、ある柵が他の柵よりも効果的である理由については説明しなかった。

AIエージェントは「報酬ハッキング」も可能です。場合によっては、AI モデルは、ユーザーが行ったことや行おうとしていることについて、ユーザーに嘘をつくことがあります。

最近の AI モデルは推論して思考の連鎖を生成する能力を持っていますが、いくつかの実験では、モデルが答えに到達するプロセスをまだ正確に反映していないことが示されています。

本質的には、アントロピックの研究者が開発したツールは、神経科学者が人間の脳をスキャンするために使用する fMRI スキャナーに似ています。これを Claude 3.5 Haiku モデルに適用することで、Anthropic は LLM モデルがどのように機能するかについての洞察を得ることができました。

研究者たちは、クロードは文中の次の単語を予測することだけを訓練されていたにもかかわらず、特定のタスクではより長期的な計画を立てることを学習したことを発見した。

たとえば、詩を書くように頼まれたとき、クロードさんはまずテーマに合っていて韻を踏める言葉を探し、それから逆算して完全な詩を書き上げました。

クロードには共通の AI 言語もあります。複数の言語をサポートするようにトレーニングされていますが、Claude は最初にその言語で考え、次にサポートされている言語で結果を表現します。

さらに、クロードに難しい問題を与え、わざと間違った解決策を提案したところ、クロードはユーザーを喜ばせるために、提案に従って自分の思考の流れについて嘘をつく可能性があることを研究者たちは発見した。

その他のケースでは、モデルが推論せずに即座に答えられるような簡単な質問をされた場合でも、クロードは偽の推論プロセスを作り上げました。

アントロピックの研究者であるジョシュ・バストン氏は、クロード氏が計算をしたと主張したにもかかわらず、何も起こっていないことを発見できたと述べた。

一方、専門家は、時には人々は自分自身さえ理解しておらず、決定を正当化するために合理的な説明を作り出すだけだということを示す研究があると主張している。

一般的に、人々は同じように考える傾向があります。心理学が共通の認知バイアスを発見したのもこのためです。

しかし、LLM は、回答を生成する方法が人間がタスクを実行する方法とは大きく異なるため、人間にはあり得ないような間違いを犯す可能性があります。

Anthropic チームは、従来の技術のように各ニューロンを個別に分析するのではなく、特性に基づいてニューロンを回路にグループ化する方法を実装しました。

このアプローチは、さまざまなコンポーネントがどのような役割を果たしているかを理解するのに役立ち、研究者がネットワークの層を通じて推論プロセス全体を追跡できるようにするとバストン氏は述べた。

この方法には、近似値に過ぎず、LLM の情報処理プロセス全体、特に LLM が結果を出す際に非常に重要な注意プロセスの変化を反映していないという制限もあります。

さらに、ニューラルネットワーク回路を定義するには、たとえ数十語程度の文であっても、専門家では何時間もかかります。この手法を拡張してより長い文を解析する方法はまだ不明だという。

制限はさておき、LLM の内部推論監視機能は、AI システムを制御してセキュリティと安全性を確保する新たな機会をもたらします。

同時に、研究者が新しいトレーニング方法を開発し、AI 制御の障壁を改善し、錯覚や誤解を招く出力を減らすのにも役立ちます。

出典: https://znews.vn/nghien-cuu-dot-pha-mo-ra-hop-den-suy-luan-cua-ai-post1541611.html

コメント (0)

トップインタレスト

最新

No data

ビエンホア空港で23機の戦闘機が一緒に訓練する勇壮な画像

ビエンホア空港で23機の戦闘機が一緒に訓練する勇壮な画像

同じカテゴリー

パイコインは底が見えず下落中

パイコインは底が見えず下落中

zingnews-vn

5 giờ trước

OpenAIは新しいモデルを発表するのでしょうか?

OpenAIは新しいモデルを発表するのでしょうか?

zingnews-vn

7 giờ trước

iPhone 17 Proの背面カメラのデザインを公開

iPhone 17 Proの背面カメラのデザインを公開

zingnews-vn

7 giờ trước

ChatGPTが再び新たなマイルストーンを達成

ChatGPTが再び新たなマイルストーンを達成

zingnews-vn

8 giờ trước

2025年万博で生命の歴史を紹介するユニークな方法

2025年万博で生命の歴史を紹介するユニークな方法

zingnews-vn

10 giờ trước

アップルのパートナーが米国への移転を拒否

アップルのパートナーが米国への移転を拒否

zingnews-vn

10 giờ trước

36の軍隊と警察部隊が4月30日のパレードに向けて訓練

36の軍隊と警察部隊が4月30日のパレードに向けて訓練

ベトナムだけでなく...、また...！

ベトナムだけでなく...、また...！

勝利と絆 in ベトナム：トップクラスの音楽と世界の自然の驚異が融合するとき

勝利と絆 in ベトナム：トップクラスの音楽と世界の自然の驚異が融合するとき

4月30日の記念日に向け、戦闘機と1万3000人の兵士が初めて訓練を行った。

4月30日の記念日に向け、戦闘機と1万3000人の兵士が初めて訓練を行った。

同じ著者

ラオス選手がVリーグで歴史的な記録を樹立

ラオス選手がVリーグで歴史的な記録を樹立

zingnews-vn

35 phút trước

プレミアリーグの歴史的瞬間

プレミアリーグの歴史的瞬間

zingnews-vn

một giờ trước

ベトナム最弱のプロクラブが初優勝

ベトナム最弱のプロクラブが初優勝

zingnews-vn

2 giờ trước

ユニークなサッカーチームの試合は雨のため3回中止になった

ユニークなサッカーチームの試合は雨のため3回中止になった

zingnews-vn

3 giờ trước

新しいオールド・トラッフォード・スタジアムを建設中、MUはどこで試合をするのでしょうか？

新しいオールド・トラッフォード・スタジアムを建設中、MUはどこで試合をするのでしょうか？

zingnews-vn

5 giờ trước

MUがオールスターチームを東南アジアへ派遣

MUがオールスターチームを東南アジアへ派遣

zingnews-vn

5 giờ trước

ビエンホア空港で23機の戦闘機が一緒に訓練する勇壮な画像

ビエンホア空港で23機の戦闘機が一緒に訓練する勇壮な画像

遺産

フエの文化遺産と観光名所の展示

フエの文化遺産と観光名所の展示

congluan-vn

12 giờ trước

チャンアンフェスティバル2025 - 千年の伝統の価値を広める

チャンアンフェスティバル2025 - 千年の伝統の価値を広める

nhandan-vn

Báo Nhân dân

13 giờ trước

ベトナムにはユネスコに認定された11の記録遺産があります。

ベトナムにはユネスコに認定された11の記録遺産があります。

tuoitre-vn

Báo Tuổi Trẻ

13 giờ trước

ミュージシャンのホアン・ヴァンのコレクションが世界記録遺産に登録されました。

ミュージシャンのホアン・ヴァンのコレクションが世界記録遺産に登録されました。

tuoitre-vn

Báo Tuổi Trẻ

11/04/2025

30以上の州が文化遺産観光と景勝地を推進

30以上の州が文化遺産観光と景勝地を推進

giaoducthoidai-vn

Báo Giáo dục và Thời đại

11/04/2025

カホムのマット作りの職業が無形文化遺産に認定

カホムのマット作りの職業が無形文化遺産に認定

vtv

Đài truyền hình Việt Nam

11/04/2025

形

第9軍管区はバクリウで伝統的なチョル・チュナム・トマイ新年を祝う

第9軍管区はバクリウで伝統的なチョル・チュナム・トマイ新年を祝う

qdnd-vn

Báo Quân đội Nhân dân

10 giờ trước

男子学生がAIの「偏った学習」を改善するための研究

男子学生がAIの「偏った学習」を改善するための研究

thanhnien-vn

Báo Thanh niên

12 giờ trước

億万長者のファム・ナット・ヴオン氏が新会社を設立

億万長者のファム・ナット・ヴオン氏が新会社を設立

nld-com-vn

Người Lao Động

13 giờ trước

美しいベトナム人女性がハーバード大学25年の歴史コンテストで最優秀賞を受賞

美しいベトナム人女性がハーバード大学25年の歴史コンテストで最優秀賞を受賞

dantri-com-vn

13 giờ trước

数十億ドル規模のブランドを変革へと導くMai Kieu Lien氏は、イノベーションについて何を語っているのでしょうか?

数十億ドル規模のブランドを変革へと導くMai Kieu Lien氏は、イノベーションについて何を語っているのでしょうか?

dantri-com-vn

11/04/2025

祖母が一生懸命ハンモックを編んでいたことを思い出しながら、9倍の男が全国の文化遺産の絵を2,000枚描いた。

祖母が一生懸命ハンモックを編んでいたことを思い出しながら、9倍の男が全国の文化遺産の絵を2,000枚描いた。

tuoitre-vn

Báo Tuổi Trẻ

11/04/2025

仕事

FPTは初の100万ドル規模のAIプロジェクトを成功裏に展開した。

FPTは初の100万ドル規模のAIプロジェクトを成功裏に展開した。

vietnamnow

11/04/2025

ホア・ファット社、プライメタルズ・グループの高品質鉄鋼生産ラインに投資

ホア・ファット社、プライメタルズ・グループの高品質鉄鋼生産ラインに投資

tuoitre-vn

Báo Tuổi Trẻ

11/04/2025

持続可能な開発に向けた新たなマイルストーン、新たなビジョン

持続可能な開発に向けた新たなマイルストーン、新たなビジョン

daibieunhandan-vn

Báo Đại biểu Nhân dân

11/04/2025

BAC A BANK、国際クレジットカードを利用する顧客への特典を拡大

BAC A BANK、国際クレジットカードを利用する顧客への特典を拡大

daibieunhandan-vn

Báo Đại biểu Nhân dân

11/04/2025

ビナミルクのCEOが若い世代に向けた革新の精神について印象的な発言

ビナミルクのCEOが若い世代に向けた革新の精神について印象的な発言

nhandan-vn

Báo Nhân dân

11/04/2025

VPBank NEOアプリで複利の8番目の驚異をお楽しみください

VPBank NEOアプリで複利の8番目の驚異をお楽しみください

nhandan-vn

Báo Nhân dân

11/04/2025

マルチメディア

No videos available

ニュース

習近平国家主席のベトナム訪問4回

習近平国家主席のベトナム訪問4回

vietnamnet

3 giờ trước

第11回中央会議におけるト・ラム書記長の閉会演説全文

第11回中央会議におけるト・ラム書記長の閉会演説全文

thanhnien-vn

Báo Thanh niên

3 giờ trước

政府は正式に地代を30％減額、申請は7月31日までに提出する必要がある

政府は正式に地代を30％減額、申請は7月31日までに提出する必要がある

tuoitre-vn

Báo Tuổi Trẻ

3 giờ trước

第14期党中央委員会の計画のための追加人員の紹介

第14期党中央委員会の計画のための追加人員の紹介

thanhnien-vn

Báo Thanh niên

4 giờ trước

合併後、中央政府が統一され、国には28の省と6つの市が存在する。

合併後、中央政府が統一され、国には28の省と6つの市が存在する。

dantri-com-vn

5 giờ trước

U17ベトナム代表ストライカー3人がキム・サンシク監督の目に留まる見込み

U17ベトナム代表ストライカー3人がキム・サンシク監督の目に留まる見込み

vietnamplus-vn

6 giờ trước

政治体制

グエン・ホアン・ロン副大臣は、ローラン・サン＝マルタン対外貿易・在外フランス人担当大臣を歓迎し、懇談しました。

グエン・ホアン・ロン副大臣は、ローラン・サン＝マルタン対外貿易・在外フランス人担当大臣を歓迎し、懇談しました。

moit-gov-vn

Bộ Công thương

2 giờ trước

ビンディン省：各地域に少なくとも1つのコミュニティ観光モデルを構築することを目指す

ビンディン省：各地域に少なくとも1つのコミュニティ観光モデルを構築することを目指す

bvhttdl-gov-vn

Bộ Văn hóa, Thể thao và Du lịch

3 giờ trước

政府は、2025年の夏に観光を促進し、需要を刺激し、観光客を誘致することを要求しています。

政府は、2025年の夏に観光を促進し、需要を刺激し、観光客を誘致することを要求しています。

bvhttdl-gov-vn

Bộ Văn hóa, Thể thao và Du lịch

3 giờ trước

文化遺産従事者のための職業行動規範の公布

文化遺産従事者のための職業行動規範の公布

bvhttdl-gov-vn

Bộ Văn hóa, Thể thao và Du lịch

9 giờ trước

同省は部署レベルの人事に関する決定を発表した。

同省は部署レベルの人事に関する決定を発表した。

mic-gov-vn

Bộ Khoa học và Công nghệ

10 giờ trước

2019年から2030年までの省エネ・効率化に関する国家プログラムに基づく2026年の課題提案および登録に関する通知

2019年から2030年までの省エネ・効率化に関する国家プログラムに基づく2026年の課題提案および登録に関する通知

moit-gov-vn

Bộ Công thương

11 giờ trước

地元

第9作業部会にチュオンサ諸島とDKIプラットフォームの視察任務を割り当てる

第9作業部会にチュオンサ諸島とDKIプラットフォームの視察任務を割り当てる

vietnamnow

38 phút trước

ムオンクオン族の障害早期発見のためのスクリーニング

ムオンクオン族の障害早期発見のためのスクリーニング

baolaocai-vn

44 phút trước

ティエンザン省の指導者らはハノイのフランス大使館を訪問し、アンドロス・ベトナム社との協力協定調印式に出席した。

ティエンザン省の指導者らはハノイのフランス大使館を訪問し、アンドロス・ベトナム社との協力協定調印式に出席した。

baoapbac-vn

Báo Tiền Giang

một giờ trước

沿岸警備隊の女性たちがクアンナム省で「原点回帰」の旅を企画

沿岸警備隊の女性たちがクアンナム省で「原点回帰」の旅を企画

baoquangnam-com-vn

Báo Quảng Nam

một giờ trước

音楽と友情が昇華した瞬間

音楽と友情が昇華した瞬間

baoquangnam-com-vn

Báo Quảng Nam

một giờ trước

2025年の海洋と島嶼の主権に関する文書、画像、一連の教育活動の展示

2025年の海洋と島嶼の主権に関する文書、画像、一連の教育活動の展示

baodanang-vn

Báo Đà Nẵng

một giờ trước

製品

古代ムオン族の村をOCOP製品に組み込む

古代ムオン族の村をOCOP製品に組み込む

baodantoc-vn

Báo Dân tộc và Phát triển

8 giờ trước

「2025年タイニン省の産業、貿易、一村一品製品、地域の特産品」フェアが間もなく開催されます

「2025年タイニン省の産業、貿易、一村一品製品、地域の特産品」フェアが間もなく開催されます

baotayninh-vn

14 giờ trước

OCOP製品が市場に登場

OCOP製品が市場に登場

vietnamnow

14 giờ trước

たけのこからOCOP製品への道のり

たけのこからOCOP製品への道のり

baothanhhoa-vn

Báo Thanh Hóa

11/04/2025

Co.opmart Quang Ngaiスーパーマーケットで40種類以上のOCOP製品を展示・紹介

Co.opmart Quang Ngaiスーパーマーケットで40種類以上のOCOP製品を展示・紹介

baoquangngai-vn

Báo Quảng Ngãi

11/04/2025

協同組合によるOCOP製品の開発

協同組合によるOCOP製品の開発

baophuyen-vn

11/04/2025