バイトダンスの開発チームによると、OmniHuman-1と呼ばれるこのマルチモーダルモデルは、キャラクターが話したり、歌ったり、動いたりする臨場感あふれるビデオを「現在のビデオ生成方法よりも優れた」品質で作成できるという。

実在の人物に似た画像、動画、音声を作成する AI 技術は「ディープフェイク」とも呼ばれ、詐欺や娯楽の分野でもますます利用されるようになっている技術です。

ByteDance は中国で最も人気のある AI 企業の 1 つです。同社の豆宝アプリは中国本土のユーザーの間で最も人気がある。

OmniHuman-1はまだ一般にはリリースされていないが、サンプル動画は急速に広まっている。

目立ったデモの 1 つは、アルバート アインシュタインのスピーチを描いた 23 秒のビデオです。 TechCrunch はこのアプリの製品を「驚くほど素晴らしい」そして「これまでで最もリアルなディープフェイク動画」と評している。

開発者によると、OmniHuman-1 では、任意の長さのビデオを作成するために、参照データとして単一の画像と、スピーチやボーカルなどのオーディオデータのみが必要だという。

出力ビデオのフレーム レートを調整できるほか、ビデオ内のキャラクターの「体の比率」も調整できます。

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
ByteDance は中国で最も著名な AI 企業の 1 つです。写真: TechCrunch

それだけでなく、非公開ソースからの19,000時間のビデオコンテンツでトレーニングされたAIモデルは、既存のビデオを編集することもでき、人間の手や足のジェスチャーを説得力のあるレベルで変更することもできます。

しかし、バイトダンスは、OmniHuman-1は特定のポーズにまだ困難を抱えており、また「低品質の参照画像」では最高のビデオは作成できないなど、完璧ではないことも認めた。

バイトダンスの新しいAIモデルは、ワシントンの技術輸出制限の取り組みにもかかわらず、中国の進歩を示している。

懸念事項

昨年、政治的なディープフェイクが流行した。モルドバでは、同国のマイア・サンドゥ大統領が辞任演説を行う様子を模倣したディープフェイク動画が作成された。

また南アフリカでは、同国の選挙を前に、ラッパーのエミネムが南アフリカの野党を支持するディープフェイク動画が話題になった。

ディープフェイクは金融犯罪にもますます利用されるようになっている。消費者は、投資を勧めたり偽の投資機会を提供したりする著名人のディープフェイクに騙されている一方、企業も上級管理職になりすました人物に数百万ドルの損失を被っている。

デロイトによれば、AI生成コンテンツは2023年に120億ドル以上の詐欺被害をもたらし、2027年までに米国で400億ドルに達する可能性があるという。

昨年2月、AIコミュニティの何百人もの人々がディープフェイクの厳格な規制を求める書簡に署名した。米国ではディープフェイクを連邦法で犯罪とみなす法律はないが、10以上の州がAI偽造を禁止する法律を制定している。

しかし、ディープフェイクを検出するのは簡単ではありません。一部のソーシャル ネットワークや検索エンジンではディープフェイクの拡散を制限する対策を講じていますが、オンライン上のディープフェイク コンテンツの量は依然として驚くべき速度で増加しています。

本人確認会社Jumioが2024年5月に実施した調査では、回答者の60%が過去1年間にディープフェイクに遭遇したと答えた。回答者の72%は、日常的にディープフェイクに騙されることを心配していると答え、一方で大多数はAI生成の偽動画の蔓延に対処するための法律の制定を支持した。

Google は、武器や監視技術の開発に AI を使用することを「承認」しました。Google は、武器や監視技術に使用するための AI ツールを設計および展開しないという「約束」を放棄しました。