CNBCによると、OpenAI は、以前の画像生成 AI ツール DALL-E と同様に動作する新世代 AI モデルである Sora を導入したとのことです。ユーザーは希望のシーンを入力するだけで、Sora が高解像度のビデオ クリップを返します。 Sora は静止画像からインスピレーションを得たビデオ クリップを作成したり、既存のビデオを拡張したり、欠落しているフレームを埋めたりすることもできます。
AI生成の動画で、サモエド犬とゴールデンレトリバー犬が夜のネオン街を戯れる
チャットボットや画像ジェネレーターが消費者やビジネスの世界に登場したのはつい最近のことですが、ビデオ作成はクリエイティブ AI の次のフロンティアになる可能性があります。コンテンツ作成は AI 愛好家を興奮させる一方で、世界の主要な政治選挙が近づくにつれて、これらの新しいテクノロジーは誤情報に関する深刻な懸念を引き起こしています。機械学習企業Clarityのデータによると、AI生成のディープフェイクの数は前年比で900%増加した。
OpenAIはSoraによって、GoogleやMetaなどの企業のビデオ生成AIツールと競争することを目指している。同様の AI ツールは、Stable Video Diffusion という製品を提供する Stability AI など、他のスタートアップからも提供されています。 Amazonはまた、コマンドに基づいて子供向けの短編アニメーションコンテンツを作成することに特化したモデルであるCreate with Alexaも開始した。
Sora は現在、1 分以内のビデオの作成に制限されています。 OpenAI は、より幅広い AI モデルを提供することを目指し、テキスト、画像、ビデオ生成を組み合わせたマルチモーダル性を目標としています。
これまでのところ、Sora は、誤情報などの領域における脆弱性がないかモデルをテストする「レッドチーム」と呼ばれる少数の安全性テスト担当者にのみ提供されています。同社は、ウェブサイトで公開されている 10 個のサンプル クリップ以外のデモはまだ公開しておらず、付随する技術ドキュメントは近日中に公開される予定だと述べている。
OpenAIはまた、Soraが生成したビデオクリップを識別できる「検出分類器」を構築しており、このAIによって作成されたコンテンツの識別に役立つ特定のメタデータを出力に含める予定だと述べている。 Meta が AI 生成画像を識別するために使用しようとしているのは、このような種類のメタデータです。
Soraは、Googleの研究者が2017年に論文で発表したTransformerアーキテクチャを使用したAIモデルです。OpenAIは発表の中で、Soraは現実世界を理解してシミュレートするモデルの基盤として機能すると述べています。
[広告2]
ソースリンク
コメント (0)