ChatGPTよりも優れたAI画像生成モデル

MidJourneyのモデルであるV7は、手などのディテールをより一貫して作成できると言われています。写真: Xeophon .

ウェブ上で最初の AI 搭載画像ジェネレーターの 1 つである Midjourney が、ほぼ 1 年ぶりに最初の新モデルをリリースしました。

V7と呼ばれるこのモデルは、4月4日深夜（米国時間）にベータ版としてリリースされました。 1週間前、OpenAIもChatGPTで同様の機能を発表し、ジブリ風の写真を作成するという新しいトレンドでソーシャルネットワーク上で急速に人気を博しました。

これまで Midjourney を使用したことがない場合は、まず自分の好みに基づいて、提案された 200 枚の画像を評価する必要があります。次に、このツールはユーザーの美的感覚に合った写真を作成することを目的として、パーソナライズされたプロフィールを作成します。 V7 は、デフォルトのパーソナライゼーションが有効になった最初の Midjourney モデルです。

ウェブサイトの「バージョン」ツールバーをクリックして、V7 を有効または無効にすることができます。さらに、このモデルは Midjourney の Discord サーバーで使用できます。

MidjourneyのCEO、David Holz氏はXの投稿でV7を「完全に異なるアーキテクチャ」と表現した。「V7はテキストコマンドの処理に関してははるかにスマートです」とHolz氏はDiscordで続けた。

同氏は、このモデルは元の画像から非常に優れた処理能力も備えているとコメントした。高画質化により画質が大幅に向上しました。手、足などの体の部位からそばかすまで、陶器の模様は細部に至るまで一貫しています。

V7 モデルから作成されたいくつかのサンプル画像。写真: X/MidJourney。

V7 は、ターボ (より高価) とリラックスの 2 つのモードに加えて、ドラフトモードと呼ばれる新しいツールをサポートしています。これにより、標準モードの 10 倍の速度と半分のコストで画像を作成できます。ドラフトモードの写真は品質が低くなりますが、ユーザーはワンクリックで写真をアップグレードして再作成できます。

Holz 氏によると、アップスケーリングやリテクスチャリングなど、一部の標準的な Midjourney 機能はまだ V7 では利用できないとのことです。これらの機能は近い将来、おそらく今後2か月以内に追加される予定だと彼は述べた。

「これは独自の強みと、おそらくいくつかの弱点も備えた、まったく新しいモデルです」とホルツ氏はDiscordに書いた。彼は、V7 では新しい文の書き方が必要になる可能性が高いと指摘し、建設的なフィードバックを提供するためにこのバージョンを試すことを奨励しています。

Techcrunchの記者カイル・ウィガーズ氏は、V7は基本的なコマンドをうまく実行できたとコメントした。「ミッドジャーニーのモデルは、少なくとも公式にはジブリスタイルに特化されているわけではないが、それでも美的に美しい作品を生み出すことはできる」と彼は付け加えた。

ベトナムのAI専門家によると、ChatGPTの画像作成機能は、MidJourneyやStable Diffusionなどの初期の画像ジェネレーターよりも使いやすく便利だそうです。しかし、OpenAI のモデルは画像品質においてまだ飛躍的な進歩を遂げておらず、以前のツールよりも劣っている可能性があります。

Midjourneyは非常に特別な会社です。 Midjourneyは、PC周辺機器メーカーLeap Motionの共同創業者であるホルツ氏によって2022年に設立されましたが、まだ外部からの投資を受けていません。

同社は収益も公表していないが、CBInsightsはミッドジャーニーの収益が2023年末までに約2億ドルに達すると予測している。同社は最近、未公開のプロジェクトに取り組むため、また、以前に発表したモデルのトレーニングを継続して動画や3Dオブジェクトを作成するため、ハードウェアチームを構築中であると発表した。

ChatGPTと同様に、MidJourneyも、画像作成者の同意を得ずにウェブから収集した画像でAIツールをトレーニングすることで、何百万人ものアーティストの権利を侵害したとして、複数の訴訟に直面している。

出典: https://znews.vn/mo-hinh-tao-anh-ai-tot-hon-chatgpt-post1543472.html