米国を離れて帰国したVILMのグエン・ホアン・クアン氏と彼の同僚は、ベトナム人が顧客ケア分野で使用できる無料の人工知能(AI)システムを開発し、毎月数十万回以上ダウンロードされている。
2023年6月、25歳のグエン・ホアン・クアンは、同僚のZaloAIの人工知能エンジニアである23歳のファム・ニュット・フイ、アイルランドのコーク大学の博士課程の学生である24歳のダオ・ミン・ユンとともに、ベトナムの人々が最先端のAI技術を最適な方法で体験できるように支援するという願いから、非営利団体VILMを共同設立しました。
約 6 か月の研究と応用を経て、チームは OpenHermes、VinaLlama、Vistral を含む 3 つの無料 AI モデルの開発に成功しました。これらは、ユーザーの意図を理解してそれに応じて行動できる AI システム (大規模アクション モデル) を開発するための基礎研究です。これらのモデルは、機械制御、介護者なしで障害者をより良く支援するロボット、プログラマーがエラーを修正するのを支援するロボット、顧客の世話をしたり無料で質問に答えたりする仮想アシスタントなどの技術分野に応用されています。
OpenHermes は月間ダウンロード数が 85,000 件に達し、HuggingFace (世界最大の AI モデル共有サイト) で最もダウンロードされた言語モデルのトップ 10 にランクインしました。スクリーンショット
OpenHermes モデルは、ChatGPT と同様に英語をサポートする大規模な言語モデルですが、スコアが優れています。ユーザーは、インターネットを必要とせずにモデルを自分のパソコンにダウンロードして使用することができます。特に、OpenHermes のトレーニング データ量は、OpenAI の ChatGPT のトレーニング データ量のわずか 1/100 です。このアプリは現在、毎月5万回以上ダウンロードされています。 OpenHermes-2.5とOpenHermes-2.5-Visionは、シリコンバレー(米国)の40以上のスタートアップ企業で使用されています。
VinaLlama と Vistral は、ベトナム市場へのサービス提供に重点を置いた 2 つの言語モデルであり、国内ユーザーが最先端の AI テクノロジーをより簡単に体験できるようにすることを目的としています。
ホアン・クアンさんは大学を卒業していないにもかかわらず、米国で7年間学び、OpenAIでChatGPT人工知能モデルの研究エンジニアとして働いていました。 2022年、彼はMicrosoftのBing Chat製品とOpenAIのデータエンジニアとして働き、数千ドルの収入を得ていました。 2023年までに、米国でテクノロジー業界のレイオフの波に直面し、クアン氏は卒業後の就職市場が非常に厳しいことに気づきましたが、ベトナムにチャンスがあることに気づき、帰国することを決意しました。
グエン・ホアン・クアン。写真: NVCC
VILM では、Quan はデータ拡張技術と AI トレーニングの研究を主に担当するチーフエンジニアです。 Nhat Huy 氏は AI のトレーニングにおける技術研究の役割を担い、Minh Dung 氏は理論研究において新しい方法を提案しています。
Quan 氏は、ChatGPT (大規模言語モデル) などの現在の大規模言語モデルはテキスト出力しか提供できないが、人間にはコミュニケーションをとり知識を獲得する方法が数多くあると説明しました。そのため、チームは言語レベルにとどまらず、さまざまな種類の入力と出力(言語、画像、動画、音声などのデータタイプを受信および出力できる)間で柔軟に動作できるシステムの作成を目指しています。
大規模アクション モデルを作成するという目標を達成するために、チームはセキュリティと速度という 2 つの問題を克服する必要がありました。現在の AI アプリケーションは主にユーザーデータを使用し、それを OpenAI などの企業のサーバーに送信して処理するため、セキュリティ上の懸念が生じます。チームは、ユーザー エクスペリエンスに影響を与えないようにパフォーマンスと速度のバランスを取りながら、モバイル デバイスで直接処理できるほど小型で高速な AI モデルの作成に重点を置きました。
実験チームは、実際のソースからのデータを使用する方法ではなく、AI から生成されたデータを使用して AI 自体に学習させました。当初、彼らは計算リソース(AIをトレーニングするためのコンピューター)を見つけるのに苦労しましたが、後に世界中の大企業や研究所を説得してスポンサーになってもらうことができました。
Quan氏は、これらの製品を作ることで、ChatGPTやBing Chatに劣らない品質で、人々がAIアプリケーションに素早くアクセスできるようになるほか、将来的にはAIモデルの研究や作成がより簡単になると述べた。ベトナムの企業は、ベトナム語と文化に制限のある ChatGPT を使用する代わりに、ベトナム語の VinaLlama をダウンロードできます。
VinaLlama 言語モデルはベトナム語の数学の問題を簡単に処理します。写真は、数学の問題を解決する VinaLlama 製品のデモです。スクリーンショット。
AIチャットボット構築プラットフォームMindmaidの創設者ダン・ハイ・ロック氏は、AIアプリケーション開発者の観点から、AIアプリケーションを導入する際に企業が最も懸念する2つの問題はコストとデータプライバシーであると認識したと述べています。この問題に対する最も満足のいく解決策は、エンタープライズ インフラストラクチャ上で実行でき、企業独自のデータを使用して学習 (微調整) できるオープン ソースの LLM モデルです。したがって、VinaLlama、VistralなどのベトナムのオープンソースLLMモデルは、ベトナムでのAIアプリケーションの促進に非常に価値があります。
「これらのオープンソースモデルにより、より多くのプログラマーや技術愛好家が、高価なGPU(グラフィックカード)インフラに投資することなく、MacBookだけでAIエンジニアの分野にアクセスできるようになります。これは、近い将来需要が高まるベトナムのAIエンジニアの育成にもつながるでしょう」とLoc氏は述べています。
クアン氏によると、ベトナム人は科学理論の基礎が非常に優れており、AIにも優れており、ChatGPTにも研究に参加する人材がいるものの、常に変化する技術の波に素早く追いつくのが難しいとのこと。 「ベトナムの人々が必要としているのは、エンドユーザーが直面する問題を真に理解し、研究を適切に方向づけるための製品を作る経験です」とクアン氏は、ベトナム人の技術支援のために無料のAIモデルを研究する理由について語った。彼は多くの国際グループと協力しており、ベトナムの研究グループとも常に協力する用意があると述べた。
ヌー・クイン
[広告2]
ソースリンク
コメント (0)