ChatGPTのCodex4種類を完全整理！初心者向け選び方と始め方

「Codexって結局いくつあるの？」「WebとアプリとCLIは何が違うの？」「GPT-5.4とminiは、どちらを選べば失敗しないの？」。このあたりが曖昧なまま触り始めると、最初の一歩で迷いやすい。しかも2026年春は更新の勢いが速く、以前の感覚で選ぶと、遠回りになりやすい時期でもある。
最初に押さえたいのは、Codexはひとつの名前で呼ばれていても、使う場所は4つ、実際に選ぶモデルは主に3系統ということだ。ここが整理できると、「いまの自分は何から始めるべきか」「無料寄りで試すのか、本気で使うのか」「速さ重視か、精度重視か」が一気に見えるようになる。
読み終わるころには、今日このあと何を開き、どの設定で、どんな最初の依頼を出せばよいかまで迷わなくなる。

ここがポイント！

Codexの4つの使い分けが、画面ごとの違いまで一気にわかる要点整理。
GPT-5.4系の選び方が、速さと精度と上限の感覚まで含めて理解できる判断基準。
今日から失敗しにくく始めるための、初回設定と最初の依頼文の実践手順。

まず結論。迷ったら4つの版をこう見分ける
1. 4つの版を一目で選ぶ早見表
モデル選びで失敗しない。初心者は3系統だけ覚えれば十分
今日から始めるなら、この順番が最短
1. 最初の依頼文は、短く細かく切る
2. AGENTS.mdを最初に作ると、毎回の説明が減る
初心者が一番ハマるのは、速さより安全設定
1. 「怖い」と感じたら確認する場所
2026年4月時点で押さえたい最新の変化
ChatGPTのCodex4種類に関する疑問解決
初心者が最初につまずく落とし穴
「知っている」と「できる」の差を埋める実践ロードマップ
現実でよくある「あるある失敗」と専門家の対処法
ぶっちゃけこうした方がいい！
よくある質問
まとめ

まず結論。迷ったら4つの版をこう見分ける

AIのイメージ

最初に混乱しやすいのは、「Codexの種類」と「モデルの種類」が混ざって見えることだ。実際には、どこで使うかと、何の頭脳で動かすかを分けて考えるとわかりやすい。
2026年4月時点で、一般ユーザーが触れるCodexの入口は大きく4つある。Web、デスクトップアプリ、CLI、IDE拡張だ。どれも同じ方向の仕事をするが、向いている場面が違う。CLIはターミナルでコードを読み、書き、コマンドを実行する形で使う。デスクトップアプリは複数スレッドやGitまわりを並行で扱いやすい。IDE拡張はVSCodeなどの編集画面の横で使いやすく、Webは入り口として最も軽い。OpenAIの開発者向け案内でも、Codexはアプリ、CLI、IDE、Webで展開されている。OpenAI+3OpenAI Developers+3OpenAI Developers+3
さらに頭脳側は、いま初心者が意識すべきものとしてはGPT-5.4、GPT-5.4mini、GPT-5.3-Codex系の3つが中心だ。普段の本命はGPT-5.4。軽い修正や速さ重視ならGPT-5.4mini。即応性を重視する場面では研究プレビューのGPT-5.3-Codex-sparkも視野に入る。公式案内でも、まずはGPT-5.4から始め、軽い作業にはGPT-5.4miniを使う流れが推されている。OpenAI Developers+2OpenAI Developers+2
だから、最初の答えはシンプルだ。「4つの版」とは使う場所の4種類、「バージョン」は主に3系統のモデルと理解すると迷いにくい。

4つの版を一目で選ぶ早見表

どれを開くか迷ったら、次の表の見方で十分だ。大事なのは「かっこよさ」ではなく、「いまの作業で一番詰まりにくい入口」を選ぶこと。

版	向いている人	最初に開く場面	つまずきやすい点
Web版	まず雰囲気を確認したい人	機能の入口を見たいとき	本格的な並行作業には物足りない
アプリ版	複数タスクを同時に進めたい人	修正、レビュー、確認を分けたいとき	最初は機能が多く見えて迷いやすい
CLI版	実装と修正を素早く回したい人	ローカルのコードを直接触るとき	承認設定を雑にすると怖い
IDE拡張版	エディタから離れたくない人	書きながら横で相談したいとき	できることがアプリ版より狭く見えやすい

アプリ版は、並行スレッド、Git機能、Worktree、Automationsをまとめて扱いやすい「司令塔」に近い。CLIは最短距離で仕事を進めやすい反面、承認やサンドボックスを雑にすると事故の入口になる。IDE拡張は「いま開いているファイルの流れを切りたくない」ときに強い。OpenAI Developers+3OpenAI Developers+3OpenAI Developers+3

モデル選びで失敗しない。初心者は3系統だけ覚えれば十分

ここでよくある勘違いが、「高性能なものだけ使えば正解」という考え方だ。実際は逆で、重い作業に強いモデルと、軽い作業を安く速く回すモデルを分けるほうが、結果も使い勝手もよくなる。

普段の本命はGPT-5.4

GPT-5.4は、推論、コーディング、エージェント的な進行、コンピュータ操作をひとつにまとめた主力だ。長めの文脈を抱えながら計画し、修正し、確認する流れに強い。OpenAIはGPT-5.4をChatGPT、API、Codexに展開し、Codexではネイティブのコンピュータ操作を備えた汎用モデルとして位置づけている。
実際の使いどころは、たとえば次のような場面だ。
「このリポジトリ全体を見て、ログイン周りの処理だけ洗い出して」
「このバグの原因候補を3つに絞って、直す前に方針を出して」
「差分を作る前に、影響範囲だけ先に確認して」
こうした、読んで、考えて、段取りを立ててから動く仕事はGPT-5.4が安定しやすい。

速さと上限を取りたいならGPT-5.4mini

初心者ほど見落としやすいのが、GPT-5.4miniの使いどころだ。軽い作業なら、むしろこちらのほうが気持ちよく進む場面が多い。公式情報では、Codex内のGPT-5.4miniはGPT-5.4の30％のクォータ消費で使え、軽いコーディングやサブエージェント処理向けに速く回せる。約3分の1の負担感で使えるイメージなので、ファイル検索、単純修正、説明文の整形、補助的な確認ではかなり扱いやすい。
迷ったときの感覚はこうだ。
「設計から頼む」「複雑な原因調査を頼む」ならGPT-5.4。
「軽い修正」「説明文の追加」「単体ファイルの見直し」ならGPT-5.4mini。
この分け方だけで、無駄に重いモデルを回して上限に早く当たる失敗をかなり防げる。

研究プレビューの高速系は無理に追わなくていい

研究プレビューの高速系モデルは、リアルタイム寄りの往復では魅力がある。ただ、初心者が最初からそこに踏み込む必要は薄い。理由は単純で、速さの恩恵を最大化するには、依頼の切り方や作業分解の精度が必要だからだ。まずはGPT-5.4かGPT-5.4miniの二択で始め、慣れてから高速系を試すほうが失敗しにくい。

今日から始めるなら、この順番が最短

最初の一歩で詰まる人は、インストールや認証そのものより、何をどの順番で触るかが曖昧なことが多い。順番を固定すると、一気に楽になる。
まずCLIは、npmで導入して起動し、初回はChatGPTアカウントかAPIキーで認証する流れになる。ChatGPTの対象プランにはCodexが含まれ、CLIはmacOSとLinuxが基本、WindowsはWSL2推奨という整理だ。OpenAI Developers+2OpenAI Developers+2
そのうえで、最初の手順は次の流れが安全だ。

まずはアプリ版かCLI版のどちらかひとつに絞って開く。複数を同時に触ると、違いを学ぶ前に疲れやすい。
モデルは最初だけGPT-5.4にする。理由は、失敗時の原因がモデル選択なのか依頼文なのかを切り分けやすいからだ。
最初の依頼は「作って」ではなく、「確認して」「計画して」から入る。いきなり実装より、現状把握のほうが事故が少ない。
承認設定は、確認を飛ばしすぎない状態で始める。最初から完全自動に寄せると、どこを触られたのか追えなくなる。
作業ディレクトリは小さくする。大きな親フォルダを開くより、対象プロジェクトだけを開いたほうが誤読も誤操作も減る。

この順番にすると、「動いたけれど怖い」「便利だけれど何を変えたのかわからない」という典型的な不安がかなり減る。

最初の依頼文は、短く細かく切る

初心者が最も損をしやすいのは、最初の依頼を大きくしすぎることだ。
「ECサイトを全部作って」
「このアプリをフルリニューアルして」
こうした依頼は、便利そうに見えて実は失敗しやすい。理由は、作業範囲が広すぎて、途中で確認すべき点が埋もれるからだ。
代わりに、次のように切ると精度が上がる。
「このフォルダを見て、起動方法だけ教えて」
「認証まわりのファイルだけ特定して」
「商品一覧APIだけ作る前提で、必要なファイルを出して」
「実装はまだせず、変更計画だけ出して」
画面上でも結果の違いがわかりやすい。大きすぎる依頼は長い出力と広い変更になりやすく、確認が苦しくなる。小さく切ると、表示される差分や提案も小さくなり、承認しやすい。公式のベストプラクティスでも、難しい作業では先に計画を立てること、指示を再利用できる形にすることが勧められている。CLIには/planも用意されている。OpenAI Developers+1

AGENTS.mdを最初に作ると、毎回の説明が減る

何度も同じ説明を打つのが面倒なら、AGENTS.mdを早めに置くと効く。Codexは作業前にAGENTS.mdを読む。たとえば、次のような情報を書いておくと、最初から意図が通りやすい。
「応答は日本語」
「実装前に変更計画を出す」
「大きな変更はファイル単位で分ける」
「機密情報を含むファイルは触らない」
「テストコマンドを先に確認する」
これを置くと、毎回「日本語で」「まず計画から」「危険な変更は避けて」と書かずに済む。プロジェクトごとに癖が違う人ほど効果が大きい。公式でも、AGENTS.mdは作業前に読み込まれる再利用向けの中心ファイルとして案内されている。OpenAI Developers+1

初心者が一番ハマるのは、速さより安全設定

多くの人が最初に注目するのはモデル性能だが、本当に差が出るのは承認とサンドボックスだ。ここを理解せずに進めると、「便利だけれど怖い」がずっと消えない。
Codexでは、サンドボックスが技術的な境界を決め、承認ポリシーが「いつ止まって確認を出すか」を決める。つまり、外に出られない柵と、動く前の確認ルールは別物だ。公式説明でも、この2つは明確に分けられている。OpenAI Developers+1
初心者が覚えるべき感覚はひとつだけでいい。
最初は「全部自動」より「中は動ける、外は止まる」に寄せること。
この考え方にすると、作業フォルダの中での編集は進みやすく、外側の危険な動きは抑えやすい。
CLIには/fastもあり、GPT-5.4で速度を1.5倍にできるが、クレジット消費は2倍になる。速さに目が向きやすいが、最初はここを触らなくていい。まずは普通速度で、差分確認と依頼の切り方に慣れるほうが効果が高い。OpenAI Developers+1

「怖い」と感じたら確認する場所

不安になったら、確認すべき場所は限られている。
ひとつはどのフォルダを開いているか。
もうひとつはどのモデルで動いているか。
そして最後がどの承認設定かだ。
この3つが見えていれば、ほとんどの不安は具体的な確認に変わる。
「いま開いている場所が大きすぎる」
「軽い修正なのに重いモデルを使っている」
「確認を飛ばしすぎる設定にしている」
こうした原因は、画面や設定でその場で直せる。

2026年4月時点で押さえたい最新の変化

最近の動きを知らないまま古いイメージで使うと、Codexを「コード補完の延長」くらいに誤解しやすい。いまはそこから一段進んでいる。
まず、Codexはデスクトップアプリ側で機能がかなり広がっている。コンピュータ操作、アプリ内ブラウザ、画像生成、メモリ、プラグイン拡張、SSH接続、複数ファイルとターミナルの扱いなど、単なるコード生成ツールではなく、仕事の進行役に近い形へ寄っている。4月後半の更新では、より多くの作業をまとめて扱う方向がはっきりした。OpenAI+1
また、直近では企業向けの広がりも加速している。4月前半に週次利用者300万人超と共有されたあと、4月22日時点では400万人超へ伸びたと案内されている。さらにBusinessでは、月額固定ではなくクレジットベースで使うCodex専用席も用意されている。個人利用だけでなく、チーム導入の入り口も広がっている状態だ。OpenAI+1
モデル面では、GPT-5.4miniがCodex全体で使いやすくなったことも大きい。これで「重い本命」と「軽い量産役」の切り分けがしやすくなった。特に初心者にとっては、全部を最強モデルで押し切らなくていいという意味が大きい。OpenAI+1

ChatGPTのCodex4種類に関する疑問解決

ここは、多くの人が途中で引っかかる部分を先回りで整理する。

Web版だけで十分？

最初に雰囲気を見るだけなら十分。ただし、実際にコードを読み替えたり、差分を見たり、複数の仕事を並行で進めたりする段階に入ると、アプリ版かCLI版のほうが楽になる。入口としては軽いが、実務の中心に据えるなら別の版のほうが伸びしろが大きい。

無料寄りで試すなら、どこから始める？

まずはChatGPT側で触れる範囲を確認し、軽い作業だけ試すのが無難だ。いきなり大きな実装を回すより、「計画を出す」「単体ファイルを説明させる」「1か所だけ直す」から入ると、上限や挙動をつかみやすい。なお、Codexを含むプランや上限は変動があり、Plus、Pro、Business、Edu、Enterpriseに含まれる案内が現行の基本線になっている。

CLIとアプリは、どちらを先に触るべき？

ターミナルに抵抗があるならアプリ版からでいい。複数の仕事を分けて見やすいからだ。反対に、普段からターミナルを触るならCLIのほうが早い。どちらが上ではなく、迷わず触れるほうが正解だ。最初に大事なのは継続できる入口を選ぶことだ。

初心者が最初につまずく落とし穴

AIのイメージ

Codexを開いたのに、いきなり何を入力すればいいかわからなくなる

最初にいちばん多いのがこれだ。画面は開けた。入力欄もある。でも、そこで手が止まる。「何を書けばいいの？」「雑に聞いたら変なことをされそう」と不安になって、そのまま閉じてしまう。特に、Codexの画面で新しいスレッドを開いたのに、入力欄を前にして3分以上止まるなら、このつまずき方をしている可能性が高い。
なぜそうなるかというと、初心者ほど最初の一言で全部を正しく伝えなきゃいけないと思い込みやすいからだ。でも実際は逆で、最初の依頼は小さいほどいい。最初から完成形を頼むより、状況確認だけ頼むほうが成功率はかなり高い。
こうすれば一発で解決する。

まず、修正したいプロジェクトのフォルダだけを開く。デスクトップ全体や親フォルダを開かない。
入力欄に、最初の1回だけは次の形で打つ。「このフォルダを見て、実装はまだせず、起動方法と主要ファイルの役割だけ日本語で教えて」。
返答が出たら、次は「では、認証に関係するファイルだけ3つまで挙げて」と聞く。
さらに次に、「まだ変更しないで。最初に直すなら1か所だけ選んで理由を教えて」と聞く。
この3往復が終わったら初回成功だ。画面に、起動方法、主要ファイル、最初に触る候補が順番に表示されたらOK。

この流れだと、「何を頼むか」を考える負担が一気に減る。最初の目的は作らせることではなく、状況を見える化することだと覚えておくと止まりにくい。

直してほしいのに、関係ない場所まで触られそうで怖くなる

次によくあるのが、「この1ファイルだけ見てほしかったのに、フォルダ全体を見始めた気がする」「修正を頼んだら、別のファイルまで触られそうで怖い」という不安だ。たとえば、1つのバグ修正を頼みたいだけなのに、差分（変更前後の違い）が複数ファイルに広がって見えると、一気に不安になる。
原因はシンプルで、対象範囲を自分で先に狭めていないからだ。Codexは賢いぶん、手がかりが少ないと「たぶんこのへんも関係ある」と広めに見に行く。初心者の感覚では「余計なことをしている」ように見えても、相手は善意で広げているだけ、ということが多い。
こうすれば一発で解決する。

修正前に、入力欄へ「今回はapp.jsだけ見て。ほかのファイルは変更候補に入れないで」と明記する。
次に、「変更前に、どの行をどう直す予定かだけ先に書いて」と送る。
返答に複数ファイル名が出たら、その時点で止める。そこで「今回は1ファイルだけで完結する案に絞って」と追加する。
差分が表示されたら、ファイル名を上から順に見る。1つだけなら進める。2つ以上なら、「複数ファイルを触る理由を1文で説明して」と聞く。
納得できる理由が出ないなら、「その変更はやめて。app.jsだけでできる最小修正版に戻して」で戻す。

このやり方だと、怖さの正体が「範囲が見えていないこと」だとはっきりする。ファイル名を先に固定するだけで、体感の安心感はかなり変わる。

英語や専門用語が急に増えて、読めるけど判断できなくなる

もうひとつ、かなり高い確率で起きるのがこれだ。たとえば、返答の中にsandbox（作業場所の外に出ないための安全柵のようなもの）、diff（変更前後の見比べ表のようなもの）、contextwindow（一度に覚えておける作業メモの広さのようなもの）などが混ざる。読めなくはない。でも、意味が曖昧なので「進めていいのか」「止めるべきか」が判断できない。
原因は、初心者が用語を知らないからではない。用語を行動に変換できていないからだ。わからないのは単語ではなく、「その単語が出たとき、自分が何を確認すればいいか」が見えていない状態だ。
こうすれば一発で解決する。

意味があやふやな言葉が1つでも出たら、そのまま進めない。
入力欄に、「今出てきた用語を、中学生でもわかる言葉で、1語ずつ1行で説明して」と入れる。
続けて、「その言葉が出た場面で、自分が確認する画面項目も教えて」と送る。
たとえばdiffなら、変更ファイル名、追加行数、削除行数を見る。sandboxなら、今の作業フォルダ外に出ない設定かを見る。contextwindowなら、会話を長くしすぎていないかを見る。
3語まで整理できたら、その日の新規用語学習は終了でいい。覚えるより、画面で何を確認するかまで結びつけば十分だ。

初心者のうちは、専門用語を全部覚えようとしなくていい。その言葉が出た場面で、どこを見れば事故を防げるか。ここだけ押さえれば前に進める。

「知っている」と「できる」の差を埋める実践ロードマップ

上の記事を読んで理解したつもりでも、実際に動けるかどうかは別だ。そこで、最初の7日間だけは「学ぶ」より「1日1個だけ終わらせる」に振り切るといい。全部で毎日15分から30分あれば足りる。大事なのは、毎日ひとつ、画面上で完了したと確認できることだ。

ここがポイント！

1日目から3日目は、触ることに慣れる期間だと割り切る。
4日目から5日目は、1ファイル修正と差分確認に集中する。
6日目から7日目で、最小の実務っぽい流れを1本通す。

1日目。入口を1つに絞る

やることは、Codexを使う入口を1つだけ決めることだ。アプリ版でもCLI版でもいいが、初日は両方触らない。たとえばアプリ版を開いた場面で、新規スレッドを作って、入力欄に「この画面で最初に確認すべき項目を3つだけ教えて」と入れる。
所要時間の目安は15分。
完了の判断基準は、画面上で「入力欄」「モデル選択」「作業対象」の3つを自分の言葉で説明できることだ。説明が口に出せればOK。

2日目。変更しない質問だけで3往復する

この日は、まだ何も直さない。修正ゼロで3往復だけする。たとえばプロジェクトを開いた場面で、「実装はせず、起動方法だけ教えて」、次に「主要ファイルを3つまで挙げて」、最後に「最初に見るべきファイルを1つに絞って」と順番に入れる。
所要時間の目安は20分。
完了の判断基準は、会話の中でファイル名が3つ以内に絞られ、最初に見る1ファイルが決まった状態になることだ。

3日目。専門用語を3個だけ整理する

この日は、画面に出た言葉を理解する練習だ。たとえばdiffやsandboxのような言葉が出た場面で、「その言葉を日常語で言い換えて。画面でどこを見ればいいかも教えて」と入れる。ノートアプリでも紙でもいいので、3語だけメモする。
所要時間の目安は15分。
完了の判断基準は、3語について「意味」と「確認する場所」を1セットで書けることだ。意味だけでは未完了。確認場所まで言えたらOK。

4日目。1ファイルだけの軽い修正をやる

この日から初めて変更を入れる。場面としては、コメント追加、文言修正、変数名のわかりやすい変更など、壊れにくいものがいい。入力欄には、「今回はreadme.txtだけ見て。誤字を3か所まで直して。変更前に修正候補だけ先に出して」と入れる。
所要時間の目安は25分。
完了の判断基準は、変更候補が先に表示され、そのあと差分を見て、自分で1回承認できたことだ。1ファイルだけで終わっていれば満点。

5日目。バグ修正ではなく、説明追加を頼む

初心者が急にバグ修正へ行くと、原因切り分けで消耗しやすい。だから5日目は、説明追加がいい。たとえばJavaScriptファイルを開いた場面で、「この関数の上に、処理内容がわかる日本語コメントを2行だけ追加して」と頼む。
所要時間の目安は20分。
完了の判断基準は、コードの動きが変わらず、コメントだけが増えた状態になることだ。差分にロジック変更が混ざっていたら、その日はやり直しでいい。

6日目。最小の実務フローを通す

ここで初めて、少し実務っぽくする。場面としては、フォームの文言修正や、エラーメッセージのわかりやすい言い換えがちょうどいい。入力欄には、「このフォームで、送信失敗時の文言を初心者向けに言い換えたい。候補を3つ出してから、選んだ1つだけ反映して」と入れる。
所要時間の目安は30分。
完了の判断基準は、候補を見て1つ選び、その選んだ案だけが反映されたことだ。候補提示→選択→反映の3段階が通ればOK。

7日目。自分専用の定型文を3本作る

7日目は、今後ラクになる仕込みをする。毎回ゼロから打たないために、定型文を3本作る。おすすめは、確認用、提案用、修正用の3本だ。たとえば次の形にする。
確認用は、「実装はまだせず、現状確認だけして」。
提案用は、「選択肢を3つ出してから進めて」。
修正用は、「今回はこの1ファイルだけで完結して」。
メモ帳に保存しておけば、次回から貼るだけでいい。
所要時間の目安は15分。
完了の判断基準は、3本の定型文を見返したとき、何の場面で使うかを即答できることだ。
この7日間をやると、「知っている」から「画面を見ながら進められる」へ変わる。最初の目標は上級者みたいに使いこなすことではない。小さい成功を7回積むことだ。

現実でよくある「あるある失敗」と専門家の対処法

失敗その1。いきなり大きすぎる依頼をして、出力も修正範囲も広がりすぎる

ありがちなのが、「せっかくだから一気にお願いしたい」と思って、最初から大きな依頼を投げるパターンだ。たとえば、ログイン機能、見た目修正、エラー改善をまとめて頼んでしまう。すると返答も長くなり、どこから確認すればいいかわからなくなる。差分も複数ファイルに広がり、「すごそうだけど見きれない」という状態になる。
根本原因は、人間側が仕事を分ける前に丸投げしていることだ。AIが悪いというより、指示の単位が大きすぎて、確認する側の頭が追いつかなくなっている。
専門家ならこう対処する。

依頼文を見直して、動詞を1個にする。「直す」「作る」「調べる」を同時に入れない。
対象を1機能に絞る。ログインならログインだけ、表示文言なら文言だけにする。
入力欄に、「今回はログイン失敗時の表示だけ。実装前に選択肢を2案出して」と打ち直す。
提案を見て1案を選んでから、「その案だけ反映して」と続ける。
作業が終わったら、次の依頼へ進む。1回の依頼で1目的までにする。

事前に防ぐ予防策は、依頼文を書く前に「今回のゴールは1文で何か」を紙に書くことだ。1文に「と」と「あと」が2回以上出るなら広すぎる。そこまでを1つの目安にすると暴走しにくい。

失敗その2。うまくいかなかった時に、前の会話を引きずったまま続けてしまう

これもかなりある。たとえば、途中で方針がズレた。なのに、そのまま追加指示だけで立て直そうとして、会話がどんどん長くなる。結果として、「さっきと言っていることが違う」「今の話は何ファイル目のこと？」となり、初心者ほど混乱が深くなる。
根本原因は、1回崩れた流れを、そのままの会話で修正しようとすることだ。会話が長くなると、文脈（いま何の話をしているかの作業メモのようなもの）が増えすぎて、人間の確認も大変になる。
専門家ならこう対処する。
まず、3往復以上ズレたら立て直す。入力欄に長文で修正を重ねるのではなく、新しいスレッドを開く。そして最初に、「前回は範囲が広がったので、今回はlogin.jsだけ、文言修正だけ、実装前に候補2つだけ」と条件を短く再定義する。要するに、会話の延命より、再スタートのほうが安いと考える。
この失敗を防ぐ予防策は明確だ。1つの会話で扱う目的は1個まで。5往復を超えたら、「このまま続けるより、新しく切ったほうが速いか」を一度考える。初心者のうちは、長い会話は得ではなく負担になりやすい。

失敗その3。修正がうまく入ったのに、自分で何が変わったか説明できない

一見うまくいっているのに、実は危ないのがこの失敗だ。差分を承認して、画面も一応動く。でも、あとで「どこをどう変えたの？」と聞かれると説明できない。翌日になると、もう怖くてそのファイルを開けない。これ、実務では地味にきつい。
根本原因は、承認を押すことがゴールになっていて、変更内容の理解が置き去りになっていることだ。初心者ほど、変更後に確認する習慣が抜けやすい。
専門家ならこう対処する。
修正後、必ず1回だけ要約を取る。場面としては、差分を承認した直後がいい。入力欄に、「今の変更を、何を、なぜ、どのファイルで直したかの3点で、100文字以内で説明して」と入れる。次に、「初心者向けに、変更前と変更後の違いを1文で言って」と聞く。これで、自分の頭に変更の意味が残る。
予防策は、毎回の作業の最後に「3行メモ」を残すことだ。
1行目に触ったファイル名。
2行目に変えた内容。
3行目に確認した結果。
この3行が残っていれば、翌日見ても怖くなりにくい。

ぶっちゃけこうした方がいい！

正直に言うと、初心者が最短で結果を出すなら、最初から全部覚えようとしないほうがいい。ぶっちゃけ、モデルの細かい違いを完璧に覚えることも、最初はそんなに重要じゃない。そこに時間を使うより、1ファイルだけ安全に触れる経験を3回積むほうが、10倍効く。
まず本音を言うと、最初はCLIとアプリの両方を追わなくていい。どちらか片方で十分だ。あれもこれも触ると、「できること」は増えるけれど「使える感覚」は育ちにくい。最初の3日は、1つの入口に固定したほうがいい。コスパで言えば、ターミナルに苦手意識があるならアプリ版、ふだん黒い画面に抵抗がないならCLI版、それだけで十分だ。
それと、ぶっちゃけバグ修正から始めないほうがいい。初心者は「直せたらすごい」と思いがちだけど、最初のバグ修正は当たり外れが大きい。原因が1か所とは限らないし、再現条件も必要になる。だから最初の3回は、コメント追加、文言修正、README整理みたいな、結果が目で見てわかる作業にしたほうがいい。達成感もあるし、差分の見方も身につく。
さらに言うと、毎回ゼロから頼まない。これがかなり大事だ。初心者ほど「自分の言葉で毎回ちゃんと説明しなきゃ」と思うけど、実際は定型文を3本持っておくほうが圧倒的に楽だ。確認用、提案用、修正用。この3本だけでかなり回る。
たとえば、
「実装はまだせず、現状確認だけして」
「選択肢を2つ出してから進めて」
「今回はこの1ファイルだけで完結して」
この3つをメモ帳に入れておく。次からは貼るだけ。これだけで迷いが半分以下になる。
あと、これはかなり本音だけど、すごい使い方を目指さなくていい。並列実行とか自動化とか高度な連携とか、そういうのは確かに便利だ。でも、初心者のうちはそこに手を出すと「便利そうだけど自分にはまだ早い」で終わりやすい。まず集中すべきなのは、たった1本だ。
「小さく頼む→差分を見る→一言で説明させる」。
この3ステップだけでいい。これを5回やるだけで、急に怖さが減る。
場面で言うならこうだ。
1つのファイルを直したい場面で、「今回はこのファイルだけ見て」と書くと、対象が狭まり、確認が楽になる。
修正してほしい場面で、「変更前に候補を2つ出して」と書くと、いきなり書き換えられず、自分で選べる。
承認したあとの場面で、「今の変更を100文字で説明して」と書くと、何が変わったか自分の中に残る。
結局、初心者に必要なのは派手な成功じゃない。怖くない成功を連続で作ることだ。1回30分でいい。1回1ファイルでいい。1回1目的でいい。その代わり、7日間だけは毎日触る。その積み重ねがいちばん近道になる。
本当に最短で結果を出したいなら、今日やることはこれで十分だ。
まず1つの入口だけ開く。
次に、1ファイルだけ対象にする。
そして、「実装はまだせず、現状確認だけして」と打つ。
そこから始めるのが、いちばん失敗しにくくて、いちばん続く。

よくある質問

最初の1回目で、何を頼めば失敗しにくい？

「このプロジェクトの起動方法を確認して」「認証に関係するファイルだけ列挙して」「実装前に変更計画だけ出して」のどれかが安全だ。いきなり作らせるより、現状把握から入ると差分が暴れにくい。画面で見える結果も理解しやすい。

GPT-5.4miniにすると、品質はかなり落ちる？

軽い仕事なら、体感では「落ちる」より「十分で速い」と感じる場面が多い。単純修正、説明追加、補助確認ならむしろ扱いやすい。設計判断や広い読解が必要な場面だけGPT-5.4に戻せばよい。

/fastは最初から使ったほうがいい？

急がないなら不要だ。/fastはGPT-5.4の速度を上げる代わりに消費も増える。最初は通常速度で依頼の切り方と確認の流れを覚えたほうが得るものが大きい。慣れてから「同じ種類の軽い仕事を数多く回す」ときに試すとよい。

Windowsでもそのまま使える？

使えるが、CLIはWSL2前提で考えたほうが安定しやすい。ネイティブWindowsでも案内はあるものの、CLIはmacOSとLinuxが基本軸で、WindowsはWSL2推奨という理解で始めるほうが無難だ。アプリ版やIDE拡張を先に触るのもよい選択だ。

本格的に使う前に、最低限やるべきことは？

対象フォルダを絞ること、AGENTS.mdを置くこと、承認を飛ばしすぎないこと。この3つだけでいい。これだけで「触ってほしくない場所を触られる」「毎回同じ説明を打つ」「何が変わったかわからない」をかなり減らせる。

まとめ

Codexで迷わないために必要なのは、難しい知識より整理の順番だ。
使う場所は4つ。Web、アプリ、CLI、IDE拡張。
初心者のモデル選びは実質2択。普段はGPT-5.4、軽い仕事はGPT-5.4mini。
最初の依頼は大きくしない。確認、計画、単体修正から始める。
今日やることはひとつでいい。アプリ版かCLI版のどちらかを開き、対象フォルダを小さく絞り、「実装はまだせず、まず起動方法と変更計画だけ出して」と頼むことだ。その1回がうまくいけば、Codexは一気に「よくわからない新機能」から「毎日使える作業相手」に変わる。