Zalo AIの才能ある若手エンジニア、Le Duy Khanh氏は、2024年9月1日から5日までギリシャで開催されるInterspeech Scientific Conferenceで、自身の科学的テーマを紹介するスピーチを終えたばかりです。
「タイムシフトコンテキストアテンションと動的右コンテキストマスキングによるストリーミング音声認識の改善」というテーマで、 2000 年生まれのエンジニアとその同僚による研究作業は、音声認識モデルのアップグレード、Zalo アプリケーションでの音声ディクテーションと音声テキスト変換の精度の向上に大きく貢献します。
この研究は、未来を「見る」のと同様に、音声認識モデルにさらに多くのコンテキストを提供することも目的としており、それによって遅延を増加させることなく精度を大幅に向上させます。これは以前の研究との大きな違いです。
「テクノロジー全般、特に音声処理の分野で世界をリードする科学会議で発表する機会を得たのは今回が初めてです。 「これが、私がAI開発の道を追求し続け、Zalo AIの研究に貢献する動機です」とDuy Khanh氏は語りました。カンファレンスでのKhanh氏のプレゼンテーションは、100人以上が視聴する中、非常にスムーズに進みました。プレゼンテーションを終えた後、Khanh 氏はアルゴリズムと処理速度について 2 つの質問を受けました。今年のInterspeech国際会議には、Microsoft、Metaなど、世界をリードする一連のテクノロジー企業が集まります。さらに、世界中のエンジニア、テクノロジー、AI研究者による2,000を超える会議プレゼンテーションとAI分野に関する新しい研究も発表されます。
ベトナムのエンジニアの研究テーマが国際的に認められているという事実は、ベトナムの若いAI産業にとって前向きな兆候です。
「このインタースピーチに参加することは、私にとって個人的なマイルストーンであるだけでなく、AIテクノロジーをベトナムのユーザーに近づけるために努力する動機でもあります。特に私たちのような若いエンジニアやベトナムのAI技術産業全体が発展するためには、研究への投資が不可欠です。 AIに取り組むには常に研究が必要であり、他社の利用可能な技術だけを使用すると、先へ進むのは難しいだろう」とデュイ・カーン氏は語った。
Zalo は 2017 年に AI 研究を開始して以来、常に Duy Khanh のような若い才能を信じてきました。現在、Zalo の従業員の最大 31% が GenZ 世代に属しています。 Zalo AI エンジニアの科学論文が国際的に認められたのは今回が初めてではありません。 2021年には、太平洋アジア人工知能会議(PRICAI 2021)でも他の2つの研究テーマが認められました。
コメント (0)