Google が Bard を Gmail、YouTube、Google マップ、フライトなどの多くのアプリに組み込んでいるという事実は、ChatGPT に対する大きな利点です。そこで OpenAI は最近、ChatGPT の無料バージョンで音声と画像の入力がまもなく可能になると発表しました。
つまり、ユーザーは iPhone や Android で入力するよりも自然な方法で ChatGPT に質問したり、画像を使用してより良い回答を得たりすることができます。重要な点は、ユーザーは ChatGPT Plus のアップデートを受け取るために料金を支払う必要がないことです。ただし、有料アカウントは試用版を利用できる最初のグループになります。
Plus および Enterprise アカウントのユーザーは、今後 2 週間以内にこのアップデートを受け取り、その後、開発者を含む他のユーザー グループにも提供されます。画像を使用して ChatGPT に入力するのが、マルチモーダル AI モデルの動作方法です。これは、検索大手が AI を搭載した Google Lens を使用する方法に似ています。
ChatGPTの2つの新機能は、Google Bardよりも多くのユーザーを引き付けると予想されています
一方、音声サポート機能は、iPhone および Android 用の ChatGPT アプリでのみ利用できます。ユーザーは、この機能を開いた後、アプリの設定でそれを有効にするだけです。 OpenAIによると、ChatGPTはテキストから人間のような音声を生成するために数秒のサンプル音声しか必要とせず、そのために新しいテキスト読み上げモデルを使用しているという。
この技術は、実際の音声からリアルな合成音声を数秒で生成することができ、多くの革新的でアクセシビリティに重点を置いたアプリケーションへの扉を開きます。しかし、有名人になりすましたり、詐欺行為をしたりする可能性があるなど、新たなリスクも生じます。 OpenAIはまた、Spotifyと提携してポッドキャストの音声翻訳機能をテストし、クリエイターが自分の声を使ってコンテンツを他の言語に翻訳できるようにすると述べた。
[広告2]
ソースリンク
コメント (0)