Google は、ChatGPT と競合する Gemini チャットボットや、テキストから画像を作成する Imagen ツールなど、人工知能 (AI) ツールの開発競争に積極的に取り組んでいるテクノロジー企業の 1 つです。しかし、説明文から動画を作成する Google の能力は、テクノロジー専門家からは依然として競合他社に比べてはるかに劣っていると考えられています。
最近、Google は、テキストを 8 秒間の高解像度ビデオに変換するためのユーザー向けツール Gemini Advanced を正式に導入しました。同時に、静止画像を同様の長さの鮮やかなアニメーション ビデオに変換する機能を備えた Whisk Animate 機能も導入されています。これら両方の機能は、Google One AI Premium に加入しているユーザーが利用できるようになります。
Google によれば、Veo 2 はビデオ作成における飛躍的な進歩であり、高解像度、詳細、リアル、映画のようなビデオを制作できるように設計されているという。 Veo 2 は、リアルな物理特性と人間の動きを捉える能力により、さまざまなテーマやスタイルで、スムーズなキャラクターの動き、鮮明なシーン、精巧なディテールを作成できます。
ビデオを作成するには、ユーザーは Gemini のモデル メニューから Veo 2 を選択する必要があります (インターフェイス上のこのオプションの位置は開発中に変更される可能性があります)。この機能では、720p 解像度の 8 秒間のビデオ クリップが作成され、16:9 の横長アスペクト比で MP4 形式でエクスポートされます。 Google はまた、ユーザーが毎月作成できるビデオの数には制限があることも指摘しています。
ユーザーは、短編小説、視覚的なアイデア、特定のシーンなど、思い描いたシーンを説明するだけです。そしてジェミニはそれらのアイデアを現実のものにします。ユーザーの説明が詳細であればあるほど、最終的なビデオ製品の品質は向上します。
Googleによれば、ユーザーはVeo 2で作成した動画をTikTokやYouTube Shortsなどのソーシャルメディアプラットフォームで簡単に共有できるという。ただし、Veo 2 で作成されたビデオのアスペクト比は 16:9 であるため、これらのビデオ プラットフォームでの共有にはまったく適していません。

ビデオ作成機能は現在、Web プラットフォームとモバイル プラットフォームの両方で、世界中の Gemini Advanced ユーザーに展開されています。ただし、この機能は、Gemini が現在提供している完全な言語サポートを備えた Google One AI プレミアム プランに加入しているユーザーのみが利用できます。
現在、Veo 2 は Google によって Gemini Advanced ユーザーに提供されており、ベトナムでのサービス価格は月額 489,000 VND です。
Veo 2に加えて、GoogleはWhisk AnimateというAIツールもリリースしました。これを使用すると、ユーザーは説明文付きの新しい画像を作成し、この画像をスムーズな動きの動画に変換できますが、Veo 2と同様に最大8秒までしか動画の長さは制限されていません。
2024 年後半にリリースされる Google Labs の実験である Whisk は、テキストと画像の両方のプロンプトを通じて、ユーザーが新しいアイデアをすばやく探索して視覚化できるようにします。ユーザーは Whisk Animate 機能を使用してアイデアを実現できます。
Whisk Animate は、Veo 2 テクノロジーを使用して、ユーザーの静止写真を 8 秒間のライブ ビデオに変換する機能を提供します。この機能は、60 か国以上の Google One AI プレミアム加入者が利用できます。

Googleはまた、安全なビデオ作成体験を確保するための重要な対策を実施したと述べた。これには、Google のポリシーに違反するコンテンツの作成を防ぐためのレッドチーム演習と詳細なレビューが含まれます。さらに、Veo 2 で作成されたすべてのビデオには SynthID タグが付けられます。SynthID は各フレームに埋め込まれたデジタル透かしで、AI で生成されたものであることが明確に表示されます。
出典: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
コメント (0)