「プロンプトを入力したのに、4枚の画像をどう選べばいいか分からない…」「グリッドモードって何?今まで通りに使えるの?」——Midjourneyを触り始めたとき、こんな疑問で手が止まった経験はありませんか?
実は、Midjourneyの基本的な仕組みを理解していない人がほとんどなんです。ツールを開いて、なんとなくプロンプトを入れて、出てきた画像に「あ、なんか違う」とがっかりする。このループを繰り返しているうちに「自分には向いていないのかも」と諦めてしまう。でも、グリッドモードの使い方さえマスターすれば、そのストレスはほぼ消えます。
しかも、2026年3月17日にリリースされたMidjourney V8アルファ版では、グリッドモードが大幅にアップグレードされました。この記事では、V8の最新情報を踏まえながら、初心者が本当に知りたいグリッドモードの全体像を一気に解説します。
- MidjourneyのグリッドモードはV8アルファ版で大幅刷新され、大量の画像を一覧表示しながら素早く選択できる強力な作業環境に進化している。
- U1〜U4ボタンでのアップスケールとV1〜V4ボタンでのバリエーション生成が、グリッド操作の基本であり、この2つをマスターするだけで作業効率が劇的に上がる。
- V8では生成速度が従来比約5倍になり、グリッドを使った試行錯誤のコストが大幅に下がったため、初心者でも短時間でクオリティの高い画像を量産できる。
Midjourneyのグリッドモードとはそもそもなにか?

画像生成AIのイメージ
Midjourneyでプロンプトを入力すると、まず4枚の画像が一度に生成されます。この「4枚が並んだ状態の表示画面」こそが、いわゆるグリッド表示です。グリッドとは「格子状の配置」を意味し、2×2の配列で画像が並ぶことからこう呼ばれています。
これはMidjourneyの最大の特徴のひとつです。1枚だけ生成するのではなく、一度に4つの異なる解釈を出力することで、あなたはその中から「自分のイメージに一番近い方向性」を選べるようになっています。いわばAIがあなたに「こういう解釈もあります、あういう解釈もあります」と選択肢を提示してくれる仕組みです。
グリッドモード(Grid Mode)は、このグリッド表示を専用の画面でさらに使いやすくした機能のことを指します。特にV8アルファ版で正式に搭載されたこのモードでは、一度に大量の生成結果を並べて俯瞰しながら比較・選択できます。これにより、「どれがいいか迷いながら1枚ずつ確認する」という旧来の非効率な作業から解放されるのです。
グリッド表示の基本的な読み方
グリッドが生成されると、4枚の画像は左上から順番に番号が振られています。左上が1番、右上が2番、左下が3番、右下が4番です。この番号はそのまま操作ボタンの数字と対応しているので、覚えておくだけで操作がスムーズになります。
グリッドの下には2列のボタンが表示されます。上の列がU1〜U4(アップスケール)ボタンで、下の列がV1〜V4(バリエーション)ボタンです。この2種類のボタンを使いこなすことが、Midjourneyを活用する上での最初のステップです。
U1〜U4とV1〜V4の違いを完全に理解しよう!
グリッドモードで最初に戸惑うのが、UボタンとVボタンの違いです。ここを理解するだけで、作業の質がガラリと変わります。
Uボタン(Upscale)は「気に入った1枚を選んで拡大・単体表示する」ボタンです。たとえば「U2」を押せば、グリッドの2番目の画像が独立した画面で大きく表示されます。このとき、V5以降のバージョンでは画像のサイズ自体は変わらず、グリッドから切り離されて単独で表示される形になります。重要なのは、Uボタンを押してもGPU時間(クレジット)は消費されないという点です。あくまでグリッドから1枚を「取り出す」操作なので、コストを気にせず使えます。
Vボタン(Variations)は「選んだ画像を元に、似た方向性の新しい4枚を生成する」ボタンです。たとえば「V3」を押すと、3番目の画像のスタイルや構図を参考にした、新しい4枚のグリッドが生成されます。こちらはクレジットを消費する操作なので注意が必要ですが、「この方向性は好きだけど、もう少し違うパターンを見たい」というときに非常に便利です。
Vボタンにはサブタルバリエーション(Subtle)とストロングバリエーション(Strong)の2段階があります。Subtleは元の画像に近い微妙な変化を、Strongはより大きく異なる変化を生み出します。ウェブアプリの設定画面でデフォルトのバリエーションタイプを変更することも可能です。
単体表示になった後にできること
Uボタンで1枚を取り出した後も、さらに細かい操作が可能です。表示された画像の下には追加のボタンが並びます。アップスケール(Subtle)は元のディテールをできる限り保ちながら解像度を上げ、アップスケール(Creative)はAIがより積極的にディテールを補完・強化します。また、Vary(Subtle)とVary(Strong)は選んだ単体画像からバリエーションを生成する機能で、Vボタンと同様に機能します。さらに、Zoom Out(ズームアウト)は画像の外側の世界を広げて描写するキャンバス拡張機能、Pan(パン)は画像の端を特定の方向へ延長する機能です。これらを組み合わせれば、最初のグリッドからどんどんイメージを進化させていけます。
V8アルファ版で進化したグリッドモードの新しい使い方!
2026年3月17日に公開されたMidjourney V8アルファ版では、グリッドモードが大きく生まれ変わりました。単に「4枚並べて見る」という従来の体験から、創造的なワークフローそのものを変えるレベルの進化を遂げています。
まず最大の変化は生成速度の約5倍高速化です。V7では1回のグリッド生成に30〜60秒かかっていたところが、V8では10秒以内に完了することも珍しくありません。これは単なる「速くなった」という話ではなく、グリッドを使った試行錯誤のリズム感が根本的に変わることを意味します。以前は「また待たないといけない…」というストレスがあった場面で、今はテンポよくプロンプトを修正して次のグリッドを確認できます。
次に、V8のグリッドモードは大量の画像を並べて一気に俯瞰できる専用画面になっています。Midjourneyの公式発表では、新しいグリッドモードを「大規模な画像セットに集中するための機能」と説明しています。従来のように1セット4枚をこまめに確認するのではなく、多くのバリエーションを一度に表示して方向性を素早く絞り込む、という使い方に最適化されています。
また、設定パネルがプロンプト入力欄の邪魔をしないよう右サイドバーに独立して移動しました。画像参照、パーソナライゼーションプロファイル、ムードボードなどもすべてサイドバーに集約されており、グリッドを見ながらリアルタイムで設定を調整できます。
V8グリッドモードを使うための新しいワークフロー
V8では「4枚グリッドを丁寧に評価する」という旧来のアプローチが変わりつつあります。新しい推奨ワークフローは次のような流れになります。
まず、通常の標準設定(–hdや–q 4なし)でプロンプトを入力し、低コストで大量のグリッドを素早く生成します。グリッドモードで多くの候補を一気に眺め、「この方向性だ!」という手応えを感じる画像を見つけたら、その画像だけを選んで高品質な–hdモード(2K解像度)でアップスケールします。この「まず量で探索して、決まったら質に投資する」という考え方が、V8時代のクレジットを賢く使うコツです。
なお、V8アルファ版は現在alpha.midjourney.comでのみ利用可能で、通常のmidjourney.comやDiscordではまだ使えません。V8で生成した画像はメインサイトのギャラリーには表示されない点も覚えておきましょう。
グリッドモードを活かすプロンプトの基本と重要パラメーター!
グリッドモードをフルに活用するには、プロンプトとパラメーターの基礎を押さえることが不可欠です。
プロンプトの書き方については、V7以降は箇条書きのキーワード羅列よりも自然な文章形式の方が高品質な結果が出るとされています。「若い女性、カフェ、朝の光」ではなく「朝の柔らかな光が差し込むカフェで、一杯のラテを前にして窓の外を眺める若い女性」のように、情景を描く文章で指示するとMidjourneyはより意図に近い解釈をしてくれます。V8では複雑で多要素のプロンプトへの忠実度がさらに向上しているので、細かく指示するほど望み通りの結果が得やすくなっています。
画像の中に文字を入れたい場合は、引用符(” “)で囲んで指示します。たとえば「看板に “OPEN” と書かれたレトロなカフェの外観」のように指定すると、V8は指定した文字を高精度でレンダリングしてくれます。日本語の文字入れにも対応が進んでおり、漢字を含む文字でも精度が大幅に上がっています。
グリッド生成に役立つ主なパラメーター一覧
以下のパラメーターはプロンプトの末尾に追加して使います。これらを活用することで、グリッドに表示される画像の方向性を細かくコントロールできます。
| パラメーター | 効果と使い方 |
|---|---|
| –ar 16:9 | アスペクト比(縦横比)を指定する。YouTubeサムネイルなら16:9、ポートレートなら2:3が便利。 |
| –raw | MidjourneyのAIが勝手にスタイルを付け加えるのを抑制し、プロンプト通りに忠実な画像を生成する。コスト削減にも効果的。 |
| –stylize 0〜1000 | 数値が高いほどMidjourneyの芸術的な解釈が強くなる。V8では–stylize 1000が推奨されることもある。 |
| –hd | V8新機能。ネイティブ2K解像度で画像を生成する。クレジット消費が4倍になるため、仕上げ段階での使用が推奨。 |
| –q 4 | V8新機能。複雑なシーンの一貫性と詳細描写を強化する。–hdと同時使用でコストが大幅増になる点に注意。 |
| –chaos 0〜100 | グリッド内の4枚の多様性を制御する。数値が高いほど4枚それぞれが大きく異なるバリエーションになる。 |
| –weird 0〜3000 | 独創性や予想外の表現を強める。アート系の画像制作で個性を出したいときに有効。 |
初心者がやりがちなグリッドモードの失敗パターンとその対策!
グリッドモードを使い始めたばかりの人がよくやってしまう失敗があります。それは最初の1グリッドを見て「なんか違う」とすぐに諦めてしまうことです。AIの画像生成は確率的なプロセスなので、1回のグリッドで完璧な結果が出ることはほとんどありません。まず数回グリッドを生成して方向性を確認し、プロンプトを少しずつ調整していくのが正しいアプローチです。
もう一つよくある失敗は最初からコストの高い設定で生成してしまうことです。V8では–hdや–q 4、srefなどを使うと通常の4倍のクレジットを消費します。これらは試行錯誤の段階では外しておき、「これだ!」という構図やスタイルが固まったときだけ使うのが賢い使い方です。
また、プロンプトが短すぎる・曖昧すぎることも失敗のもとです。「美しい風景」のような指示では、4枚のグリッドがバラバラな解釈になってしまい、一貫した方向性を掴みにくくなります。被写体、設定、照明、雰囲気、構図を意識して、具体的な情景を言葉で描くクセをつけましょう。
–chaosパラメーターをグリッド探索に活用する
グリッドモードで多様なアイデアを素早く探索したいときに便利なのが–chaosパラメーターです。たとえば「–chaos 50」をプロンプトに追加すると、4枚のグリッドがそれぞれ大きく異なる解釈で生成されます。方向性が全く決まっていない初期段階では、–chaosを使って幅広いアイデアをグリッドで確認してから、気に入った方向性に絞ってVボタンで深掘りするという流れが非常に効果的です。逆に、特定の画風やスタイルを安定させたい場合は–chaosの値を0に近づけると、4枚のグリッドが均質なバリエーションになります。
グリッドで使えるMidjourney実践プロンプト集!そのままコピーして使えます

画像生成AIのイメージ
ここからはグリッドモードとの相性が特に良い、カテゴリ別の実践プロンプトを紹介します。これらはV8アルファ版での動作を想定していますが、V7でも十分に機能します。プロンプトをそのままコピーして試してみてください。
【ポートレート・人物撮影系】グリッドで方向性を探るのに最適なジャンルです。
- Natural smartphone portrait of a young Japanese woman in her late 20s, sitting in a warmly lit café in Tokyo, wearing a soft beige turtleneck, black hair loosely tied, looking gently at the camera with a calm expression, shallow depth of field, morning light through window, film grain texture –ar 2:3 –raw –v 8
- Street fashion editorial, stylish Japanese man in his early 30s, wearing an oversized dark trench coat and white sneakers, standing in a narrow Shibuya alley at dusk, neon reflections on wet pavement, cinematic color grade, 35mm lens –ar 2:3 –stylize 400 –v 8
- Cozy home office scene, a woman in her 40s focused on a laptop screen, warm afternoon sunlight streaming from the left, bookshelf background slightly out of focus, a cup of tea on the desk, natural authentic mood, iPhone-style candid photo –ar 4:3 –raw –v 8
上の3つのプロンプトは「被写体の年齢と雰囲気」「場所と光源」「スタイルの指定」という3つの要素を必ず含んでいる点がポイントです。この構造をベースに自分なりにカスタマイズするだけで、グリッドの4枚が一気に使えるレベルに近づきます。
【SNSサムネイル・バナー系】文字入れが必要な場面に使えるプロンプトです。V8の引用符テキスト機能と組み合わせて使いましょう。
YouTubeサムネイルを作りたいなら、たとえば「Bold Japanese YouTube thumbnail design, a shocked young woman pointing at glowing text, dramatic studio lighting, dark gradient background with electric blue accents, bold text “本当に効果あった?” in bright yellow on the right side, high energy, clean composition –ar 16:9 –v 8」のような形が機能します。文字は引用符で囲むことと、テキストの位置(right side、center、topなど)を明記することがコツです。
【ロゴ・ブランドビジュアル系】商業利用を想定したシンプルなビジュアルには–rawとのセットが効果的です。
「Minimalist Japanese cafe brand identity visual, clean white background, a simple overhead flat lay of a ceramic coffee cup with latte art, small succulent plant, wooden coaster, warm neutral color palette, soft shadow, professional product photography style –ar 1:1 –raw –v 8」このように「白背景+フラットレイ+–raw」の組み合わせは、ブランド素材として使いやすい清潔感のある画像をグリッドに安定して出してくれます。
【アート・イラスト系】Midjourneyの独自の美学を最大限に引き出すプロンプトです。
「Ethereal Japanese forest spirit, a translucent fox deity emerging from ancient cedar trees, luminescent particles floating, deep indigo and gold color palette, ink wash painting style fused with digital art, dreamlike atmospheric perspective –ar 3:4 –stylize 800 –v 8」–stylizeの値を600〜1000の間で変えながらグリッドを何度か生成すると、同じプロンプトでも全く異なる芸術性の画像が出てくるので、その差を見比べる作業自体が楽しくなります。
実際によくある「あるある」困った体験と、その具体的な解決手順!
Midjourneyを使い続けていると、教科書には載っていないけれど現実には必ずぶつかる「あの壁」があります。ここでは、よくある具体的な困り事を体験ベースで話しながら、他のサイトではなかなか教えてくれない実践的な解決方法を紹介します。
困った体験1グリッドの4枚が全部「外れ」で、何度やっても同じような微妙な画像しか出ない
これ、めちゃくちゃあるあるです。「猫が窓辺に座っている」というプロンプトを入れたら、4枚全部が似たような「普通すぎる猫の写真」になって、何度再生成しても大差ない…という状況です。
原因はほぼ間違いなくプロンプトの情報量が少なすぎて、AIが「平均値」を出し続けているためです。Midjourneyは指示が曖昧なほど、学習データの中の「最もよくある表現」に引っ張られます。
解決手順は次の通りです。まずプロンプトに「照明の情報」を追加します。「soft morning golden light from the left window」など光の方向と質感を指定するだけで、グリッドの雰囲気ががらりと変わります。次に「カメラ視点や距離感」を追加します。「close-up shot」「low angle」「bird’s eye view」などを入れると、4枚それぞれが異なる構図になりやすくなります。それでも変化が乏しければ–chaos 30〜50を末尾に追加してみてください。グリッド内の4枚の「バラつき度」が上がるので、「外れ4枚」の確率が劇的に下がります。
困った体験2プロンプトをどれだけ詳しく書いても、手や指だけが必ず崩れてしまう
これは多くのユーザーが経験する、Midjourneyの定番の悩みです。全体的にはかなり良い画像なのに、手の部分だけ指が6本あったり、関節がおかしな方向に曲がっていたりする。V8でだいぶ改善されていますが、それでも完全ではありません。
現実的な対処法として最も有効なのは「最初は1:1の正方形アスペクト比で生成する」という方法です。なぜか、ワイドな比率(16:9など)で生成するよりも正方形の方が人体のプロポーションが安定しやすいという実態があります。
手順としては、まず「–ar 1:1」で手が含まれる人物画像を生成し、グリッドから良いものをU1〜U4で選択します。次にアップスケール後に「Zoom Out 1.5x」または「Zoom Out 2x」を使ってキャンバスを外側に広げます。こうすることで、人物の中心部(手が問題になりにくいエリア)を保持したまま、画角を広げることができます。最後に必要であれば、ダウンロードした画像をPhotoShopや無料ツールのCanvaでクロップして好みの比率に仕上げます。
また、プロンプト側の対処として「hands behind back(手を後ろに隠す)」「hands in pockets(ポケットに手を入れる)」「arms crossed(腕を組む)」といった手が直接見えないポーズを指定するのも、シンプルながら強力なテクニックです。「戦略的に手を隠す」という発想転換です。
困った体験3「これはいい!」と思った画像のスタイルを次のグリッドでも再現しようとしたら、全然違う雰囲気になってしまった
「昨日生成した画像、すごく良かったからまた同じ感じで作りたい」と思って同じプロンプトを入力しても、なぜか全然違う雰囲気の画像が出てくる。これはMidjourneyが毎回ランダムなシードから生成するために起きる現象です。
これを解決するには–seedパラメーターを使うか、またはスタイルリファレンス(–sref)を活用します。
–seedを使う方法は、気に入った画像が出たときに、その画像の右上あたりに表示される絵文字アイコン(Discord版)やウェブアプリのメニューからシード番号を確認して控えておくことです。次回同じプロンプトの末尾に「–seed XXXXXXXXX」と入力すると、近い結果が再現されやすくなります。
より実用的な方法はスタイルリファレンスです。気に入った画像をいったん保存してから、新しいプロンプトの際に「–sref [画像URL]」として指定します。これにより、元画像の色彩、質感、雰囲気を参照しながら新しい内容の画像を生成できます。V8ではV7のsrefとの後方互換性があるので、以前作ったお気に入り画像のスタイルをV8のグリッドでも引き継いで使えます。
困った体験4グリッドを見るたびに「どれを選べばいいかわからなくなる」迷子状態に陥る
これ、誰でも経験しています。特に–chaosを高めに設定すると4枚が全部バラバラになって、「全部なんか違う気がするけど、どれかは使えそうな気もする…」という沼にはまります。
この「選択疲れ」を防ぐ実践的なアプローチは、「何を目的として生成しているかを先に決める」という当たり前に聞こえて意外とできていないことです。
SNSに投稿する用の画像なら「スクロールが止まるかどうか」を基準にします。クライアントへの提案素材なら「目的のビジュアルイメージと近いかどうか」を基準にします。個人的なアート制作なら「自分が見ていて気持ちいいかどうか」を基準にします。この目的別の「選ぶ軸」を最初に決めてから画面を開くと、迷う時間が大幅に減ります。
また、「全部しっくりこない」と感じるときは、Vボタンではなくプロンプトを修正して再生成する方が結果的に速いことがほとんどです。「この4枚は方向性が違う」と感じたら、プロンプトの最初の1〜2文を書き直してみましょう。バリエーションを増やし続けるより、根本のプロンプトを直す方が正解に近づくスピードが圧倒的に上がります。
困った体験5V8アルファに切り替えたら、今まで使っていたプロンプトで微妙な画像しか出なくなった
V8に移行したユーザーの多くがこの体験をしています。V7でうまく機能していたプロンプトをそのままV8に持ち込んだら、なぜかV7より質が低く見える画像が出た、という現象です。
これはV8が設計思想として「プロンプトテキストの忠実な解釈」よりも「パーソナライゼーション+スタイライズによる美的な補完」を重視するモデルになっているためです。MidjourneyはV8のベストな使い方として、–stylize 1000とパーソナライゼーションプロファイルを組み合わせることを推奨しています。
V8でのプロンプト修正の基本ステップは以下の流れです。まず既存のプロンプトの末尾に「–raw」を追加します。これでV8の独自解釈が抑制されてプロンプトへの忠実度が上がり、V7と近い感触に戻ります。それでも物足りなければ「–stylize 200〜500」の範囲で試してみます。さらに良い画像を目指すなら、パーソナライゼーションプロファイルを設定して「–p」(パーソナライズオン)を追加し、–stylize 1000で試してみるとV8本来の力が発揮されます。V8はデフォルト設定ではなく、パーソナライズありきで動くモデルだと理解するのが適応の最大のコツです。
V8グリッドモード活用のためのパーソナライゼーション設定ガイド!
グリッドモードを使い込んでいく上で、長期的に一番効果を発揮するのがMidjourneyのパーソナライゼーション機能です。これを設定しているかどうかで、グリッドに出てくる画像のクオリティが根本から変わります。
パーソナライゼーションとは、MidjourneyのAIに「あなた好みの美的センス」を学習させる機能です。2026年2月26日のアップデートで、以前の1対1比較方式からクリック&スクロール式のグリッドレーティングに変更され、セットアップが最大5倍速くなっています。
設定の基本的な流れは、midjourney.comのパーソナライズ設定ページにアクセスして、表示されるグリッドの中から「自分が好き」と感じる画像をクリックしていくだけです。「嫌い」な画像も積極的にスキップ(評価しない)することが重要で、好みの画像を200枚以上レーティングすると、プロファイルの精度が大幅に上がります。
実際にグリッド生成でパーソナライゼーションを有効にするには、プロンプトに「–p」を追加します。たとえば「autumn mountain landscape, misty morning, golden light –ar 3:2 –p –stylize 600 –v 8」のように書くと、あなたの美的好みを反映した方向性でグリッドの4枚が生成されます。同じプロンプトでも–pの有無で結果が驚くほど変わるので、一度実験してみてください。
複数のパーソナライゼーションプロファイルを使い分けることも可能です。たとえば「写真リアル系の仕事用プロファイル」と「アート・イラスト系の個人用プロファイル」を分けて持っておくことで、シーンに応じてグリッドの雰囲気を切り替えられます。
ぶっちゃけこうした方がいい!
ここまで読んでくれた人には正直に言います。Midjourneyのグリッドモードについて、みんなが「上手い使い方」を語るときに、実は誰も言ってくれない核心的なことがあります。
それは、グリッドを「正解を探す場所」だと思っている限り、永遠に使いこなせないという話です。
「4枚の中に正解があるはず」「もう少し生成すれば完璧な画像が出るはず」という考え方のまま使い続けると、クレジットだけがどんどん消えていく。これが一番多い沼です。
個人的にぶっちゃけ楽だし効率的だと思うのは、グリッドを「正解を探す場所」ではなく「自分がまだ言語化できていないイメージを発掘する場所」として使う発想の転換です。
具体的に言うと、最初のグリッドはほぼ捨てる前提で生成する。完璧を求めない。「あ、この方向性は違うな」「この雰囲気は近いけど構図が違う」というフィードバックを自分が得るためだけにまず生成する。そのフィードバックをもとにプロンプトを修正して次のグリッドを生成する。この繰り返しをやっていると、3〜5グリッド目には自分の脳内イメージが急速に言語化されてきて、プロンプトがどんどん精度を上げていきます。
V8はこの「探索→発見→言語化→生成」のループが、5倍の速度で回せるようになったモデルです。速さを「たくさん生成できる」ためではなく「試行錯誤のサイクルを高速で回す」ために使う。この使い方ができている人は、同じクレジット量で圧倒的に良い画像に辿り着きます。
もう一つ言うと、パーソナライゼーションの設定を後回しにしているなら、今すぐやった方がいい。後でやろうと思いながら使い続けると、実は「V8の本来の力の半分も引き出せていない状態」で何百枚も生成していることになります。パーソナライゼーションは一度セットアップしてしまえば、以後ずっと全グリッドの品質に効いてくる、コストゼロの永続的な武器です。
ぶっちゃけ、「プロンプトの書き方を勉強する」より「パーソナライゼーションプロファイルを育てる」方が、長期的にグリッドの質を上げる効果が大きい。これが今の僕の正直な結論です。グリッドモードに慣れてきたら、次の一手はプロンプト研究ではなくパーソナライゼーション強化に投資してみてください。きっと「こんなに変わるの?」と驚くはずです。
ミッドジャーニーのグリッドモードに関する疑問を解決!
グリッドモードはどこでオンにできますか?
V8アルファ版(alpha.midjourney.com)では、画面右側のサイドバーからグリッドモードを選択できます。通常のmidjourney.comでは、生成したプロンプト結果のグリッドが自動的に表示される仕様になっており、特別な設定は不要です。V8アルファ専用UIでは、グリッドモードボタンをクリックすることで大量の画像を集中して俯瞰できる専用ビューに切り替わります。
グリッドのU1〜U4ボタンを押すとクレジットは消費されますか?
V5以降のMidjourneyでは、U1〜U4ボタン(アップスケール)を押してもGPU時間(クレジット)は消費されません。これはグリッドから画像を「取り出す」操作に過ぎず、新たな生成は行われないためです。ただし、取り出した後に「アップスケール(Subtle)」や「アップスケール(Creative)」を実行する場合、またV1〜V4でバリエーションを生成する場合はクレジットを消費します。V8では–hdを使った高解像度アップスケールが通常の4倍のコストになるので注意が必要です。
グリッドで生成した画像を保存するにはどうすればいいですか?
まずU1〜U4ボタンで気に入った画像をグリッドから切り出して単体表示にします。その後、ウェブアプリ上では画像をクリックしてフルサイズ表示にし、右上のダウンロードアイコンをタップするだけです。PCの場合はフルサイズ表示した状態でブラウザを通じて右クリック→「名前を付けて画像を保存」でも保存できます。スマートフォンの場合は画像を長押しして表示されるダウンロードアイコンをタップします。
グリッドモードとコンバセーション(会話)モードはどう使い分けますか?
V8から搭載されたコンバセーションモードは、LINEのような感覚でAIと会話しながらプロンプトを修正・発展させていくモードです。「猫を描いて→やっぱり犬にして→アニメ調に変えて」という連続した会話で画像を調整できます。一方、グリッドモードは大量の生成結果を一覧して比較・選択することに特化した表示モードです。アイデアを探索する段階でコンバセーションモードを使い、候補が絞れてきたらグリッドモードで複数の最終候補を比較するという使い分けが効果的です。
V7のスタイルやムードボードはV8グリッドモードでも使えますか?
はい、V7で作成したパーソナライゼーションプロファイル、ムードボード、スタイルリファレンス(–sref)はすべてV8でも互換性があります。ただし、V8アルファ版では–srefやムードボードを使った生成はコストが通常の4倍になります。また、–hdと–q 4を同時に使うことはできず(現時点ではRelaxモードでは使用不可)、一部の機能の組み合わせには制限があります。正式版リリース時に改善が予定されているので、アルファ版の制限はあくまで一時的なものと考えてください。
まとめ
MidjourneyのグリッドモードはAI画像生成の「試行錯誤」を楽しくするための中心機能です。4枚の候補を同時に提示して選ばせる仕組みは、AI生成特有の「正解が分からない」という不確実性を逆に武器に変えてくれます。
2026年3月にリリースされたV8アルファ版では、グリッドモードが大規模な画像の俯瞰に特化した専用ビューに進化し、生成速度も約5倍に高速化されました。さらにサイドバー設定の導入によって、グリッドを見ながら直感的に設定を変更できる快適なワークフローが実現しています。
重要なのは、U/Vボタンの役割を正確に理解し、試行錯誤の段階では低コスト設定で探索し、方向性が固まったときだけ高品質オプションを使うというメリハリのある使い方です。グリッドモードをただ「画像を確認する場所」ではなく「アイデアを育てる作業台」として活用することで、AI画像生成のポテンシャルが最大限に引き出されます。
まずは今日、プロンプトをひとつ入力してグリッドを生成してみてください。最初の4枚を眺めるだけで、Midjourneyがどれほど豊かな可能性を秘めているかを実感できるはずです。


コメント