「ベトナムのデータを習得することは、ベトナムの技術を開発し習得するための第一歩です」

Báo Thanh niênBáo Thanh niên27/05/2024

[広告_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

米国の大規模な人工知能組織で働いた後、なぜ母国に戻って VinBigdata に入社することにしたのですか?

米国で働いていた間、私は多くの大規模な政府プロジェクトに参加しましたが、私が達成した成果は、大規模な処理手順の中のほんの数ステップに過ぎないことがよくありました。実際、プロジェクトの非常に厳格な機密保持手順のため、私が開発したソリューションがどのように使用されているかさえわからないことがよくあります。

2017年にベトナムに戻ったとき、ベトナムは発展段階にあり、ビッグデータや人工知能に関して解決すべき問題がたくさんありました。私は、ベトナムの人々の生活に役立つベトナムの技術ソリューションを開発するという目標を共同で実現するために、Vu Ha Van教授の招待を受け入れました。より大きな影響力のある問題に取り組めるので、ベトナムに戻ることはさらに意義深いと感じています。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

ワークショップに参加したダオ・ドゥック・ミン博士

人工知能の開発戦略において、ビッグデータはどのような役割と影響力を果たすのでしょうか?

データは人工知能のトレーニングにおいて非常に重要な役割を果たします。高品質の人工知能モデルのトレーニングは、通常、大規模なデータセットのトレーニングから始まります。したがって、質の高い人工知能を実現するには、まず良質なデータが必要です。

優れたデータは、量と規模、品質、多様性、普遍性の点で適切な品質である必要があります。生データのクリーニングから人工知能モデルに入力する最高品質のデータの作成まで、何千時間ものデータを収集して処理するプロセスは、コストがかかり複雑です。対照的に、ビッグデータを分析するには、人工知能を使用して、大規模にデータを正確に処理する能力を確保し、より優れた決定的または予測的な結果を生み出す必要があります。

例えば、ベトナム人向けのバーチャルアシスタント製品(ViVi)を開発する過程では、さまざまな地域、年齢、性別、数百分野にわたるコンテンツを含む数十万の音声から、数万時間分の高品質オーディオデータを収集して処理する必要がありました...

また、最近では、VinBigdata が完全に所有する大規模言語モデルから開発された「エンドユーザー向けの ChatGPT の最初のベトナム語バージョン」である ViGPT がリリースされました。このモデルは、さまざまな分野からの 600 GB の微調整されたベトナム語データでトレーニングされています。私たちはベトナム語とデータに関する知識を活かし、ChatGPT 誕生後わずか 9 か月で ViGPT のリリース時間を短縮する新しいアプローチを見つけました。

これがビッグデータと人工知能の共鳴です。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

研究と実用的な価値を結び付けて地域社会に貢献することについて、どのような見解をお持ちですか?

- 技術研究は、実際に生活に取り入れられ、社会問題を解決し、人々の生活を向上させて初めて、真に成功すると私は信じています。

ビジネスや社会の問題を解決する実用的な商用製品を作成するには、常に注意を払い、「データはどのような価値をもたらすのか」という質問をする必要があります。

これまで当社は、ViGPT、医療画像診断におけるAIソリューションを提供するVinDr、バイオ人工知能プラットフォームのVinBase、スマート画像分析ソリューションセットのVizoneなど、さまざまな業界や分野向けにさまざまな製品とソリューションを研究開発してきました。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Vingroup CorporationのイベントでVinBigdataの主要メンバーと

第4次産業革命が世界規模で活発に起こっています。ベトナムにはどんな利点があると思いますか?

これまでの革命と比べると、ベトナムは現在、第4次産業革命を突破する上で多くの利点があり、世界地図上での同国の地位の向上に貢献していると思います。この目標を達成するための 2 つの鍵は、データと人材です。

ベトナムの人口は現在約1億人で、そのうち若者の多くが携帯電話やパソコンを使用しています。さらに、当社には人工知能の分野で定評のある専門家や、情報技術分野の若くて優秀な人材がおり、数学の基礎も非常にしっかりしています。

では、制限は何でしょうか?

最初の明らかな制限は、人口が多いにもかかわらず、データの習得、特に施設、事業部門、管理部門でのデータの標準化と同期が依然として困難であることです。

さらに、投資リソース、特に高性能コンピューティング インフラストラクチャへの投資が限られているなどの制約にも直面しています。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

あなたの意見では、ベトナム人の生活に役立つテクノロジーを創造し習得する過程において、ベトナムのデータ習得の役割はどれほど重要ですか?

現在、世界には数多くの先進的な人工知能製品があり、典型的には、OpenAI の ChatGPT や Google の Bard など、大規模な言語モデルに基づいて生成する AI アプリケーション製品です。しかし、ベトナム語はこれらの製品の開発における主な言語グループではありません。

そのため、ユーザーに返されるベトナム語特有のコンテンツの品質は多かれ少なかれ影響を受け、エラー、さらに危険なことに、基礎知識のエラーが発生する可能性が高くなります。

ベトナム人として、私たちは独自のデータソースにアクセスできるという利点があります。ベトナムのデータの特性、ベトナム人のニーズや特性を理解できるのは私たちだけです。したがって、ベトナムのデータを習得することは、ベトナムの人々に役立つテクノロジーであるコアテクノロジーを習得するための鍵となります。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

VinBigdataメンバー向けの社内トレーニング

特に、現在ベトナム人のほとんどが海外からソーシャル ネットワーキング サイトを使用している場合、特定のデータ ソースにアクセスするにはどうすればよいでしょうか。

事実、今日(ベトナム人に限らず)の人間のデータの最大の情報源はインターネットとソーシャル ネットワークにあります。ただし、各プロジェクトで設定された特性に応じて、ベトナムのデータ特性を理解した上で、さまざまなソースからデータにアクセスして収集することは可能です。

たとえば、OpenAI の GPT モデルには数百、あるいは数兆ものパラメータがあり、膨大な量のデータでトレーニングされており、数十億ドルのコストがかかります。彼らと比較して、私たちは研究、能力、リソースに基づいて、まったく異なる方向性を選択しました。つまり、わずか数十億のパラメータのアーキテクチャを持ち、独自に収集して改良した 600 GB のベトナム語データセットでトレーニングされたベトナム語モデルを作成し、ベトナム語の処理能力という点では同等の機能を持たせるというものです。結果は、当社が独自に開発したアーキテクチャが自己最適化し、言語モデルのトレーニング時間を短縮し、モデルの品質を確保しながらコストを削減できることを示しています。

人工知能製品の研究開発の過程で、あなたとあなたのチームが直面した課題は何ですか?

最初の課題は間違いなく時間です。人工知能技術の波は非常に速いスピードで到来しており、好況期にあります。世界中で、大手テクノロジー企業が、継続的に更新・改良された完成度の高い製品を次々と発売しています。遅れて製品を時間通りに納品できない場合は、確実に遅れをとることになります。

一方、実際に応用でき、社会の課題を解決する製品を作りたいのであれば、製品の優れた特徴、特別な特徴、ユニークな特徴を見つけて開発することも考慮しなければなりません。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

ベトナム人工知能デー(AI4VN 2023)でのプレゼンテーション

実際、ベトナムや世界中で多くの個人や組織がデータ漏洩により大きな損失を被っています。データセキュリティの問題をどのように考えていますか?

今日のあらゆるアプリケーションはデータから生まれていると言えます。データを扱う際には、一方ではデータを活用して生活に最適なテクノロジーを生み出すという目標を確実に達成する必要があり、他方では個人や組織のデータ セキュリティを確保する必要があります。

人的要素は、データ セキュリティ プロセスにおいて非常に重要な要素です。開発者、製品ユーザー、ユーザーなどが含まれます。開発者は、データの収集と処理の最初からデータ セキュリティを意識する必要があります。

何も起こらないときは、データ セキュリティの重要性を認識していないことがよくあります。しかし、データ侵害が実際に発生した場合、被害は甚大になる可能性があります。データ侵害は、技術的な問題や意図的なデータ盗難攻撃によって発生する可能性があります。データが漏洩すると、個人や組織の情報が悪意のある人物によって違法な目的で使用される可能性があり、企業は関連する問題を解決するための経済的損失を被り、ブランドにダメージを与えることさえあります。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

イベントでのDao Duc Minh博士とVinBigdataチーム

ベトナム国民のために技術を習得したいという志の先には、世界へ進出するステップがあるのでしょうか?

自社製品を国際市場に投入したい組織や企業は、国際基準に準拠する必要があります。 VinBigdata はソリューションとテクノロジーに強みを持っているため、世界を征服するというビジョンを設定するのは自然なことです。

もちろん、さまざまな製品やアプリケーションを展開するには、長年の経験と世界中のユーザーに対する理解を持つ国際部門のサポートが必要です。

ありがとう!


[広告2]
出典: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

コメント (0)

No data
No data

同じトピック

同じカテゴリー

同じ著者

No videos available