Midjourneyが全部捨てた
2026年3月17日、Midjourney V8 Alphaが公開された。
「Alpha」という慎重な名前とは裏腹に、これは改良版ではない。MidjourneyはV7までのPythonベースのコードベースを完全に捨てて、GPUの上で直接動く新しいアーキテクチャをゼロから書き直した。
ソフトウェアの世界で「全部書き直す」は禁じ手に近い。既存のコードには何百ものバグ修正と最適化が積み重なっており、それを捨てるということは、同じ問題を最初からやり直すリスクを負うということだ。多くの企業がこの判断に失敗してきた。
Midjourneyはそのリスクを取った。結果として得たものは、速度5倍、2K解像度のネイティブ生成、そしてテキスト描画の実用化だ。
「アップスケール」が要らなくなる
V8で最もインパクトが大きいのは、**HDモード(--hdオプション)**だ。
これまでのMidjourneyは1024x1024ピクセルの画像を生成し、それを後からアップスケーラー(解像度を引き上げる後処理)で拡大していた。拡大すれば当然、細部がぼやける。元の生成物にない情報を補間するので、「なんとなくシャープに見えるが、よく見ると不自然」という仕上がりになりがちだった。
V8のHDモードは、最初から2K解像度(約2048x2048ピクセル)で画像を生成する。アップスケールという工程自体が不要になる。印刷用途、大判ポスター、商品パッケージ——こうした「高解像度が必須」の現場で、ワークフローが1ステップ減る。
地味に聞こえるかもしれないが、プロの制作現場では「1ステップの削減」が全体の効率を大きく変える。100枚の画像を作るなら、100回のアップスケール工程が消えるということだ。
テキスト描画がついに「読める」
AI画像生成の長年の弱点の1つが、テキスト描画だった。
ポスターに「GRAND OPENING」と入れたい。看板に「営業中」と書きたい。商品ラベルにブランド名を入れたい。こうした要望に対して、これまでのAI画像生成は「文字っぽいものは出るが、読めない」という残念な結果を返してきた。文字が崩れる、余計な文字が混じる、スペルが間違う——デザイナーは生成画像のテキスト部分だけをPhotoshopで手直しする、という本末転倒な作業を強いられていた。
V8では、テキスト描画が実用的なレベルに達した。プロンプトに引用符で囲んだテキスト(例: "GRAND OPENING")を入れると、看板やラベルやポスターの上に正確に描画される。さらに--q 4オプション(高品質モード)を使えば、細部の一貫性が上がり、テキストの精度もさらに向上する。
これだけで、SNS運用担当が毎回やっていた「AIで画像を作る→テキスト部分をPhotoshopで修正する」という工程が消える。ECサイトの商品バナーやInstagramの投稿画像を月100枚以上作っている現場では、この変化のインパクトは大きい。
Style Creatorという「ブランドの記憶」
V8で新たに追加されたStyle Creatorは、自分好みのビジュアルスタイルを定義・保存し、以降の生成すべてに一貫して適用できる機能だ。
これまでは、特定のスタイルで画像を生成したければ、毎回プロンプトに長いスタイル指定を書く必要があった。「cinematic lighting, muted color palette, 35mm film grain, soft focus background, ...」といった文言を、生成のたびにコピー&ペーストする。複数のクライアントを抱えるデザイナーにとって、これはかなりの手間だった。
Style Creatorは、この「スタイル指定」をプロファイルとして保存する。クライアントAのスタイル、クライアントBのスタイル、自社ブランドのスタイル——それぞれを1クリックで切り替えられる。ブランドガイドラインをAIに「記憶」させるという発想だ。
まだAlpha。本番投入は慎重に
ここで冷静な注意を入れておく。V8はAlpha版だ。
安定版ではない。バグがある。商用利用で予期しない問題が出る可能性がある。alpha.midjourney.comという専用サイトでのみ利用可能で、Discord(これまでMidjourneyの主要インターフェースだった)からはまだ使えない。
過去にも、Stable Diffusion SDXLのAlphaリリースを本番ワークフローに組み込んで、不安定な出力にクライアントワークで振り回された事例がある。V8の場合も、重要な案件はV7で安定運用しつつ、V8はテストと探索に限定するのが現時点での賢明な判断だ。
画像生成AIの「コモディティ化」は来るか
V8は間違いなく素晴らしいアップデートだが、一歩引いて見ると、画像生成AI市場そのものが変化の渦中にある。
DALL-E 3はChatGPTに統合されて手軽さで勝負し、Stable Diffusion 4はオープンソースでカスタマイズ性を武器にしている。IdeogramはV8に先行してテキスト描画で名を上げ、Adobe Firefly 3はCreative Cloudとの統合と明確な商用ライセンスで企業ユーザーを囲い込んでいる。Flux Proという新興勢力も、品質とスピードのバランスで急成長中だ。
「どのツールでも同じような品質の画像が出せる」時代が、すぐそこまで来ている。そうなったとき、Midjourneyの優位性は「画質」から「ワークフロー設計力」——Style Creatorのようなブランド統一機能や、Moodboard(気分やテーマを視覚的に整理するボード)のような制作プロセスへの統合度——に移っていくだろう。
ツールの品質差は縮まる。差がつくのは、ツールをどう組み合わせて使うかという設計の部分だ。V8のHDモードやStyle Creatorが真に価値を発揮するのは、それ単体ではなく、Claude CodeやKlingやElevenLabsと組み合わせた「AIスタック」の中に位置づけた時だ。
V8は1つのツールとして見ても優れている。だが、それを「自分の制作ワークフローのどこに、どう組み込むか」を考えることの方が、ずっと重要だ。
出典: Midjourney公式(V8 Alpha) / Midjourney Docs / WaveSpeed / MindStudio
