3月25日のライブストリームイベントで、OpenAIは、ユーザーがチャットボットとの会話を通じてChatGPTを使用して画像を編集する方法を実演しました。たとえば、ChatGPT に街中のカタツムリの写真を作成するように依頼し、その後帽子などの詳細を追加したり、背景を変更したりできます。
ChatGPT によって生成された画像。写真: OpenAI
OpenAIによると、ChatGPTは明確な入力があればより良い画像を生成でき、グラフ作成をサポートし、仕事用のロゴをデザインできるという。ユーザーはチャットボットにメニューやマップの作成を依頼したり、複雑な画像レイアウトの指示を実行したりできます。
OpenAI は、汎用アプリケーションを目指して、ChatGPT を検索、音声アシスタント、ビデオ作成などの機能と統合しています。最新の改良により、この製品はイーロン・マスクのGrokを含む他のチャットボットと競争できるようになり、個人と企業の両方のニーズに応えることができるようになる。
ただし、ChatGPT の画像生成機能はまだ完璧ではなく、たとえば画像にスペルミスがある可能性があります。 OpenAI によると、こうしたエラーは、ユーザーのプロンプトが十分に詳細でない場合によく発生するそうです。 AI は、小さな文字やラテンアルファベット以外の文字を生成するのも困難です。
CEO のサム・アルトマン氏によると、ChatGPT は詳細レベルが高いため、画像の生成に約 1 分かかるとのことです。 GPT-4o は、ChatGPT のデフォルトのイメージング モデルとして DALL·E に代わるものとなり、ChatGPT Free、Plus、Team、Pro を含むすべてのユーザーが利用できます。
OpenAIは、昨年リリースしたGPT-4oの進歩は、モデルのトレーニングデータにラベルをつけた「人間のコーチ」のチームによって可能になったと述べている。
しかし、画像を生成するために AI を使用することは依然として議論の余地があります。アーティストの中には、こうしたツールが自分たちの作品を「模倣」し、自分たちの生活を脅かすのではないかと懸念する人もいる。 OpenAIは、GPT-4oは公開データとShutterstockなどのパートナーからの独自ソースでトレーニングされたと主張している。
(WSJ、ブルームバーグによると)
出典: https://vietnamnet.vn/chatgpt-tao-anh-sieu-thuc-ve-do-thi-cho-nguoi-dung-2384665.html
コメント (0)