AI4VN 2023でベトナム語を話すAI MCを体験しましょう

VnExpressVnExpress22/09/2023

Saltlux は、10 時間の会話データと 1 時間の録音を使用して、ベトナム語を理解して流暢にコミュニケーションできる MC と AI アシスタントを再現します。

SaltluxのAIアシスタントとMetahuman(仮想空間で実際の人間を再現する)は、ホーチミン市で開催されているベトナム人工知能フェスティバル( AI4VN 2023 )の枠組み内で行われたAI Expo展示会の来場者から大きな注目を集めたモデルの1つです。

AI アシスタントは ChatGPT などの人気のチャットボットと同様に動作しますが、多くの状況でベトナム語で柔軟かつ正確にコミュニケーションできます。一方、Metahuman は、デジタル環境で任意の人物のコピーを作成することで、多くの人を興奮させます。

これら 2 つのモデルを組み合わせると、リアルタイムで更新される情報を使用してベトナム語でコミュニケーションできる興味深い MC AI バージョンを作成できます。

9月21日にホーチミン市で開催されたAI4VN展示会で、来場者がAIアシスタントとメタヒューマンのモデルを体験しました。写真: クオン・ニャ

9月21日にホーチミン市で開催されたAI4VN展示会で、来場者がAIアシスタントとメタヒューマンのモデルを体験しました。写真: クオン・ニャ

Saltlux の技術により、1 時間の録音と約 10 時間の会話で自分自身のクローンを作成できるようになります。十分な画像データが収集されると、AI は実際の人物の画像、表情、動き、イントネーションを自動的にコピーし、仮想 MC としてシミュレートして、さまざまな状況で活用できるようになります。

各人の顔の特徴や表情を正確に描写するために、開発者は多くの知識グラフ認識技術を統合し、セマンティックセグメンテーション、ポーズ推定、顔認識、手振り、年齢層分類、性別などを可能にしました。そのため、仮想MCバージョンは実際のものとほとんど同じように見え、一般のユーザーは違いをほとんど認識できません。

次に、音声分析技術により自然言語が処理され、実際の人物の音声とイントネーションが正確に再現されてから、仮想 MC モデルに挿入されます。 Saltlux は、Hybrid-Tacotron ディープラーニング モデルを使用して、AI が中音域と高音域の両方の人間の声を再現できるようにし、最大限の安定性とパーソナライゼーションを保証します。

そして、テキストから音声、そしてその逆(音声からテキスト)を可能にする音声合成エンジンにより、AI MCと人がベトナム語で直接スムーズに対話できるようになります。

実際の騒がしい状況でも、Saltlux の MC AI は現場で話されたセリフを完全に聞き取り、それを文字に変換してから、与えられたコマンドを実行します。 AI はさまざまな地域のアクセントを適切に認識し、ユーザーが突然話題を変えた場合でもコンテンツに素早く反応します。ユーザーは音声、ドラッグアンドドロップコマンド、またはチャットボックスにコンテンツを入力することで AI と対話できます。

このベトナム語を話す AI MC のプラスポイントの 1 つは、回答の正確さです。 Saltlux は ChatGPT のように回答を生成するのではなく、各フィールドを分割することで回答を最大限に制御します。たとえば、ニュースの場合、AI は信頼できるニュースソースからのみニュースを取得します。 AI は結果を統合して提供した後、記事を引用し、ユーザーが詳細を読みたい場合にリンクに直接アクセスできるようにします。

観光地に関する質問をする場合、開発者は事前にコンテンツを準備し、それをさまざまなコンテキストに当てはめてユーザーの質問を予測し、高い精度で適切な回答を提供します。各コンテンツ領域を分割し、入力フィルターと出力フィルターを柔軟に作成することで、AI チャットボットの自己構成回答の「錯覚」が大幅に軽減されます。

韓国では、この AI モデルを使用して「Goodpy National Assistant」が開発され、政府が 2,000 万人に公共行政サービスを提供するために使用されています。ベトナムでは、AIと仮想MCモデルが2年前にSaltluxによって研究され、運用されていました。最も顕著なアプリケーションの 1 つは、Tam Chuc パゴダ複合施設のバーチャル ツアー ガイドです。このシステムは、訪問者が質問に答えたり、指示や道順を伝えたり、各場所について説明したりするのを支援するだけでなく、各人の位置をリアルタイムで正確に判断し、適切な指示を提供することもできます。

Ploonet Studio プラットフォーム インターフェースを使用すると、ユーザーは強力なデバイスを必要とせずに AI を使って自分でコンテンツを作成できます。写真: クオン・ニャ

Ploonet Studio プラットフォーム インターフェースを使用すると、ユーザーは強力なデバイスを必要とせずに AI を使って自分でコンテンツを作成できます。写真: クオン・ニャ

仮想 MC と音声が用意されると、ユーザーは Ploonet Studio プラットフォームでコンテンツとホスティング スタイルをカスタマイズして、ビデオを大量生産できます。

Ploonet Studio のインターフェースもシンプルで、ユーザーはクリックして約 2 分待つだけで、システムによって新しいビデオが公開されます。すべてはクラウド サーバー上で実行されるため、端末の設定は必要ありません。ラスベガスで開催されたCES 2023で、Ploonet Studioプラットフォームがイノベーション賞を受賞しました。

Saltlux の担当者は、同社の AI モデルにより作業効率が 20% 向上し、運用コストが 30% 以上削減され、24 時間 365 日の高可用性が確保されると述べています。

このMC AIモデルを操作するには、ユーザーは2つの料金を支払う必要があります。実在の人物を仮想空間に再現するための固定料金。パッケージ価格は、お客様が要求する難易度に応じて異なります。 2 つ目の料金は、Ploonet Studio でビデオを作成するためのもので、時間単位で課金されます。 Saltlux は個々の顧客に対する具体的な価格を明らかにしていない。同社は企業や政府機関の顧客をターゲットにしている。

ウェブ


コメント (0)

No data
No data

同じトピック

同じカテゴリー

インドネシアはト・ラム書記長夫妻を歓迎するため大砲を7発発射した。
ハノイの街中で公安省が展示した最先端の装備と装甲車両を鑑賞しましょう
「トンネル:暗闇の太陽」:国の資金援助なしで制作された最初の革命的な映画
ホーチミン市では、開業日に何千人もの人々が地下鉄1号線の乗車を待っている。

同じ著者

遺産

仕事

No videos available

ニュース

省庁 - 支部

地元

製品