PerplexityのGPT-5.3-Codexサブエージェントが凄すぎる！自動コーディングの全貌と使い方

「AIに頼んでもコードを書いてくれるだけで、実際にデプロイまではやってくれない……」そんな不満、ずっと感じていませんでしたか？2026年3月6日、Perplexityが公開したアップデートがその常識を根底から覆しました。GPT-5.3-Codexという専用コーディングサブエージェントがPerplexity Computerに組み込まれ、ゼロから数千行のコードを書き上げ、バグを修正し、GitHubに直接プッシュするところまでを、ほぼ自動でこなすようになったのです。これは単なる「賢くなったチャットBot」の話ではありません。AIが初めて本物の「デジタル作業員」として機能し始めた歴史的な瞬間です。

ここがポイント！

Perplexity ComputerにGPT-5.3-Codexが専用サブエージェントとして統合され、コーディング・デバッグ・GitHub自動プッシュまで一貫して自動化。
SWE-Bench Proで56.8%、Terminal-Bench 2.0で77.3%を記録し、前世代より最大26.5ポイント向上した驚異的なベンチマーク性能。
フルスタックアプリ構築・データパイプライン自動化・既存ツールのクローンまで、非エンジニアでも会話するだけで実現可能。

そもそもPerplexity Computerとは何か？
GPT-5.3-Codexとは？知っておくべき核心スペック
Perplexity ComputerにGPT-5.3-Codexが統合された意味
1. 「コーディングの専任担当」がチームに加わった
2. 実際に何ができるようになったのか？
2026年3月時点での最新動向を総まとめ
1. 同じ週に同時進行していた関連アップデート
2. 競合環境はどう変わったか？
Perplexity AIだからこそ使えるコーディング特化プロンプト集
「AIに頼んだのに全然動かない！」よくある現実の問題と解決法
カスタムスキルで「AI作業員の育て方」が変わった
Perplexity Computerのクレジット消費の現実と節約術
他ツールとの正直な使い分け基準
Perplexity AIのコーディング活用で陥りやすい落とし穴
1. 落とし穴①AIが書いたコードをそのまま本番にデプロイしてしまう
2. 落とし穴②Perplexityを「検索ツール」として過小評価し続けている
ぶっちゃけこうした方がいい！
GPT-5.3-Codexサブエージェントに関する疑問解決
まとめ

そもそもPerplexity Computerとは何か？

AI検索エンジンのイメージ

GPT-5.3-Codexサブエージェントの話に入る前に、その土台となるPerplexity Computerの全体像を理解しておく必要があります。Perplexityは2026年2月25日に「Computer」を正式ローンチしました。一言で表すなら、「目標を与えるだけで、AIが勝手にサブエージェントを立ち上げて仕事を終わらせてくれる汎用デジタルワーカー」です。

従来のAIチャットツールは、質問に答えて終わりでした。しかしPerplexity Computerは違います。課題にぶつかった瞬間、自分で新しいサブエージェントを生成して問題を解決しに行きます。APIキーの取得、情報のリサーチ、コードの即席生成、そして人間の判断が本当に必要なときだけ確認を求めてくる、という動き方をします。Perplexityによれば、このワークフローは「数時間から数ヶ月」継続して動き続けることができます。

もうひとつの大きな特徴が「モデル非依存」のアーキテクチャです。Perplexity Computerは19種類のAIモデルを統合しており、各サブタスクの性質に応じて最適なモデルを自動的に選択します。コア推論にはClaude Opus 4.6を、深いリサーチにはGemini 3.1 Proを、軽量かつ高速な処理にはGrokを、長文コンテキストの処理にはGPT-5.2を活用するという「チームとして機能するAI」の仕組みです。そしてこのチームに、2026年3月6日のアップデートでコーディング専任の精鋭として加わったのがGPT-5.3-Codexというわけです。

GPT-5.3-Codexとは？知っておくべき核心スペック

GPT-5.3-CodexはOpenAIが2026年2月5日にリリースした、同社史上最も強力なエージェント型コーディングモデルです。Anthropicが同日Claude Opus 4.6をリリースしてからわずか20分後に発表するという、業界の激しい競争を象徴するタイミングでのデビューでした。

このモデルの最大の特徴は「コーディングエージェントとして設計された汎用ワークエージェント」である点です。単にコードを生成するだけでなく、リサーチから実装、デバッグ、テスト、デプロイ、監視まで、ソフトウェア開発の全工程を自律的に遂行するように設計されています。しかも驚くべきことに、OpenAIはこのモデルの開発過程でGPT-5.3-Codex自身を使い、自分自身のトレーニングのデバッグや、GPUクラスターの動的スケーリングスクリプトの作成まで行わせたと明かしています。AIが自分自身の誕生に関与したという、まさに前代未聞の開発手法です。

性能面でも群を抜いた成果を残しています。ベンチマークの詳細を以下の表で確認してみましょう。

ベンチマーク	GPT-5.2-Codex（旧世代）	GPT-5.3-Codex（新世代）	改善幅
SWE-Bench Pro（実際のGitHub課題解決率）	56.4%	56.8%	+0.4ポイント
Terminal-Bench 2.0（ターミナル操作能力）	64.0%	77.3%	+13.3ポイント
OSWorld-Verified（コンピュータ操作能力）	38.2%	64.7%	+26.5ポイント
処理速度	基準値	25%高速化	体感差あり

特に注目すべきはOSWorld-Verifiedの数値です。前世代から実に26.5ポイントもジャンプしており、これはAIが「コードを書く」だけでなく「コンピュータを操作する」という能力で人間に近づいていることを示しています。ちなみに人間のOSWorld-Verifiedスコアは約72%なので、GPT-5.3-Codexは64.7%という、人間に近い水準まで到達しています。

また、前世代モデルよりも少ないトークン数で同等以上の結果を出せるという効率性の向上も見逃せません。API利用料金が使用トークン数に比例する現実を考えると、これはコスト面でも実務上の大きなメリットになります。

Perplexity ComputerにGPT-5.3-Codexが統合された意味

「コーディングの専任担当」がチームに加わった

2026年3月6日のアップデートによって、Perplexity Computerの内部にGPT-5.3-Codexが専用コーディングサブエージェントとして組み込まれました。これが何を意味するのか、もう少し具体的に説明します。

これまでのPerplexity Computerも、コーディングタスクを処理する能力は持っていました。しかし今回の統合により、複雑なコーディング課題に遭遇したとき、Computerは自動的にGPT-5.3-Codexへ処理を委譲するようになりました。書き込む対象コードの規模が大きく、多段階にわたる実装が必要な場合でも、GPT-5.3-Codexが本番品質の数千行のコードを書き上げ、ブラウザの開発者ツールを使ってバグを修正し、最終的にGitHubへ直接プッシュするところまでを一気通貫で行います。

これを比喩で表すなら、「プロジェクトマネージャーのComputer」が「コーディングのプロであるGPT-5.3-Codex」に仕事を振る構造です。あなたは目標だけを伝えればよく、誰がどのツールを使うかはAI側が最適に判断してくれます。

実際に何ができるようになったのか？

公式の発表によれば、以下のような用途での活用が想定されています。まず、フルスタックアプリをゼロから構築するケースとして、「Reactフロントエンド、Pythonバックエンド、Perplexity Financeのライブ株価データを使った個人向け資産管理アプリを作って」というような指示を出すだけで、完全なアプリケーションが出来上がります。次に、データパイプラインの自動化として、Googleアナリティクスのデータを毎日取得し、前週比トレンドを比較して毎週月曜日にサマリーをメールで送るスクリプトを自動で構築するような使い方も可能です。さらに、既存ツールのクローンと改善として、DuolingoのレッスンフローをWebアプリとして再現しながら、日本語の漢字学習に特化した独自機能を追加する、といった応用もできます。

こうした作業を指示するのに、プログラミング知識は必要ありません。あなたが「こんなものを作りたい」と日本語で伝えるだけで、GPT-5.3-Codexがその意図を汲み取り、実装します。

2026年3月時点での最新動向を総まとめ

同じ週に同時進行していた関連アップデート

GPT-5.3-Codexサブエージェントの統合だけでなく、同週のPerplexity Computerは複数の大型機能を同時リリースしています。カスタムスキル機能では、繰り返し行うタスクの手順を一度教えると永続的に記憶し、毎回同じ説明をしなくても良くなります。たとえばSlack向けの週次パフォーマンスレポートのフォーマットを一度定義すれば、以後は「週次レポートを作って」と言うだけで自動的に同じ形式で出力してくれます。

モデルカウンシルという機能も同時に登場しました。これはGPT-5.4、Claude Opus 4.6、Gemini 3.1 Proの3つのフロンティアモデルを並列で走らせ、それぞれの回答の一致点・相違点・独自の洞察をまとめて提示してくれる機能です。重要な意思決定や複雑なビジネス判断の前に「3つのAIが揃って同じ答えを出しているか」を確認できる、強力な検証ツールになっています。現時点ではMaxプランのサブスクライバー向けに提供されています。

さらにボイスモードも実装され、タイピングなしで音声会話しながらプロジェクトを進行させたり、途中で方向修正を指示したりできるようになりました。また、GPT-5.4とGPT-5.4 Thinkingの両モデルも、同時期にProおよびMaxプラン向けに展開されています。GPT-5.4はGPT-5.3-Codexのコーディング能力を継承しつつ、コンピュータ操作と知識作業の両方で追加の強化が施されたモデルです。

競合環境はどう変わったか？

2026年3月現在、AIコーディングエージェントの競争は凄まじい激しさです。Claude Opus 4.6はSWE-bench Verified（検証済みのGitHub課題解決率）で80.9%を記録しており、純粋なコーディング性能という軸では依然として最高水準にあります。対してGPT-5.3-Codexの強みはターミナル操作とコンピュータ操作にあり、Terminal-Bench 2.0での77.3%はClaude Opus 4.6を5ポイント以上上回っています。

この2つの特性がPerplexity Computerの中で巧みに組み合わさっています。コア推論とプロジェクト管理にはClaude Opus 4.6を使い、実際のコード実装とターミナル操作にはGPT-5.3-Codexを使うという、それぞれの得意分野を活かしたハイブリッドな分業体制が実現しているのです。

Perplexity AIだからこそ使えるコーディング特化プロンプト集

AI検索エンジンのイメージ

ここからは、Perplexity AI（特にComputerとLabsモード）を使う人に向けた、実際に現場で役立つプロンプトをご紹介します。ポイントは「Perplexityが持つリアルタイム検索力」と「GPT-5.3-Codexのコーディング力」を同時に引き出す書き方です。ChatGPTやClaudeに同じプロンプトを入力しても同じ結果にはなりません。最新のドキュメント・ライブラリ情報をリアルタイムで参照しながらコードを生成するという、Perplexityならではの強みを活かした設計になっています。

まず、フルスタックアプリを一発で立ち上げたいときのプロンプトから見てみましょう。以下のように入力すると、Perplexity ComputerのGPT-5.3-Codexサブエージェントが構成要素を自動分解して実装してくれます。

ここがポイント！

「ReactとFastAPIを使った家計簿アプリを作って。カテゴリ別の月次支出グラフをChart.jsで表示し、データはSQLiteに保存。2026年3月時点で最新の依存関係バージョンを使うこと。」
「Pythonで、Yahoo Financeから日経225の過去1年分のデータを毎朝8時に自動取得し、前日比騰落率と52週高安値との乖離率をSlackに送るスクリプトを書いて。」
「このコードにバグがあって動かない。ブラウザのdevtoolsのコンソールに出ているエラーを貼るから、何が原因か特定して修正版を出して。その際、なぜそのバグが発生するのかも初心者にわかるように説明して。」

3つ目のプロンプトが特に重要です。「devtoolsのエラーをそのまま貼って原因と修正を同時に求める」というパターンは、Perplexityの検索機能がライブのStack Overflowや公式GitHubのissueを参照しながら回答するため、他のAIツールよりも最新バージョン固有のエラーに強いのです。

次に、非エンジニアが業務効率化のために使えるプロンプトも見てみましょう。プログラミング知識ゼロでも成立します。

「毎月Googleスプレッドシートに手入力している売上レポートを自動化したい。担当者名、商品カテゴリ、金額の3列があるCSVを毎月末に受け取っている。それをGoogleスプレッドシートに自動転記して、カテゴリ別の集計と前月比をグラフ付きで表示するGoogle Apps Scriptを書いて。」

このように「今やっている作業の具体的な状況」と「欲しい結果」を書くだけで、Perplexity ComputerはGPT-5.3-Codexを呼び出してスクリプトを生成し、必要に応じてGoogle Apps Scriptの最新ドキュメントをリアルタイムで参照しながら動くコードを書いてくれます。

「AIに頼んだのに全然動かない！」よくある現実の問題と解決法

問題①生成されたコードをコピペしたら即エラーが出た

これ、本当によくある話です。「AIが書いたコードなんだから動くはず」と思って貼り付けたら、ターミナルが真っ赤になった……という経験、誰しもあるんじゃないでしょうか。原因のほとんどはバージョン違いです。AIが学習したデータと、あなたの環境にインストールされているライブラリのバージョンがズレていることで起きます。

解決策はシンプルで、プロンプトに「私の環境はNode.js 22.x、React 19.x、TypeScript 5.8.xです」と最初から明記することです。Perplexityの場合、ここにさらに「最新のドキュメントを検索したうえで」という一文を加えると、Perplexityのリアルタイム検索機能が働いて最新の公式ドキュメントを参照しながらコードを生成してくれます。これはPerplexity固有の強みで、学習データが古い静的なAIには真似できません。

問題②長い処理を頼んだら途中で止まった

「データベースのマイグレーションスクリプトを書いて」「テーブル30個のER図を作って」といった重いタスクを1回のプロンプトで頼むと、途中で止まったり、不完全な状態で出力が終わってしまうことがあります。これはAIのコンテキストウィンドウ（一度に処理できる情報量）の制限が原因です。

Perplexity Computerを使う場合の解決策は「タスクを段階的に分割して依頼すること」です。たとえば「まずテーブル設計だけ出して」→「次にその設計に基づいたマイグレーションファイルを書いて」→「最後にロールバックスクリプトを書いて」という流れで進めると、各ステップで精度の高い出力が得られます。Perplexity Computerはセッション間で作業コンテキストを記憶する設計になっているため、前のステップの内容を毎回説明し直す必要がないのも大きな利点です。

問題③「最新情報で調べて」と言ったのに古い情報が出てきた

ChatGPTで「2026年のトレンドを教えて」と聞いても、知識カットオフ以降の情報は出てきません。でもPerplexityに「2026年3月時点のNext.jsの最新バージョンと主要な変更点を教えて、公式ドキュメントを参照して」と聞くと、リアルタイムでWebを検索した上で回答してくれます。この「リアルタイム検索＋コーディング支援の融合」こそがPerplexityの本質的な差別化ポイントです。

特にコーディング文脈では、「このライブラリ、まだメンテされてる？」「このAPIエンドポイント、仕様が変わってない？」といった質問にも、Perplexityは最新の公式リポジトリやリリースノートを参照して答えてくれます。静的な知識しか持たないAIには、この機能がそもそも存在しないのです。

問題④何度やり直してもコードの品質が上がらない

「もっとちゃんとしたコードにして」「きれいにリファクタリングして」といった曖昧な依頼を繰り返しても、AIは何をもって「ちゃんとした」と判断すればいいのかわかりません。結果として同じような出力が返ってきてしまいます。

解決策は評価基準を具体的に明示することです。たとえば「このコードをリファクタリングして。基準は①SOLID原則に準拠、②関数は20行以内、③コメントは英語で書く、④TypeScriptのstrictモードでエラーが出ないこと、の4点。変更箇所には変更理由も日本語でコメントして。」のように書くと、Perplexityは明確な評価基準に沿ったコードを出力します。GPT-5.3-Codexはターミナル操作能力が高いため、こうした厳密な要件定義に応えて複数ファイルをまたいだ整合性のある修正ができます。

カスタムスキルで「AI作業員の育て方」が変わった

今回の3月6日アップデートで同時に実装されたカスタムスキル機能は、GPT-5.3-Codexサブエージェントと組み合わせることで、個人の「AI作業員」をカスタマイズできる仕組みです。これはClaudeのClaudeコードやOpenAIのCodexが先行して持っていたSKILLS.md方式に近い概念で、Perplexityがついにそれに追いついたと見ることができます。

仕組みとしては、マークダウン形式の指示書（スキル）を一度設定しておくと、Computer側が関連するタスクを自動検出して対応するスキルを読み込み、その手順に従って作業してくれるというものです。たとえば以下のようなカスタムスキルを定義できます。

「コードレビュースキルPythonコードのPRが来たら①型安全性、②テストカバレッジ、③ドキュメントの3点を100点満点でスコアリングし、改善すべき箇所を優先度付きでリスト化する。出力は日本語で、マークダウン形式で出力する。」

このスキルを一度登録しておけば、次からPythonのコードを貼り付けて「レビューして」と言うだけで、毎回同じフォーマットのレビュー結果が返ってきます。毎回長い指示を書く必要がなくなるのは想像以上に快適です。

Perplexity Computerのクレジット消費の現実と節約術

月額200ドル（約3万円）のMaxプランには月間10,000クレジットと初回ボーナス20,000クレジットが含まれています。しかしここで多くのユーザーが直面する現実があります。「思ったよりクレジットが早く減る」という問題です。

Perplexity Computerはタスクの複雑さに応じてクレジットを消費します。シンプルな検索や短いコード生成は数クレジット程度ですが、「フルスタックアプリをゼロから構築」「大規模なデータパイプライン構築」のような長時間タスクは、1回で数百クレジットを消費することがあります。GPT-5.3-Codexサブエージェントが絡む複雑なコーディングタスクは特にクレジット消費が大きい傾向があります。

実際に使う際の節約術として知っておきたいのは、まずProプランのLabsモードで短時間の試作をしてから、方向性が固まった段階でMaxプランのComputerで本格実装するという「二段階使い分け戦略」です。Labsモードはクレジット制ではなく、Proプランの通常利用枠で動くため、アイデアの検証コストを大幅に抑えることができます。また、カスタムスキルでよく使うワークフローをあらかじめテンプレート化しておくことで、毎回の試行錯誤によるクレジット浪費を防げます。

他ツールとの正直な使い分け基準

Perplexity ComputerのGPT-5.3-Codexサブエージェントを手放しで礼賛するのは正直ではありません。実際には「これよりClaude Codeの方が向いている」「これはChatGPTの方が速い」という場面も明確に存在します。以下の表は2026年3月時点での使い分けの現実的な基準です。

やりたいこと	最適なツール	理由
最新ライブラリを使ったコード生成	Perplexity Computer	リアルタイム検索で最新ドキュメントを参照できるため
大規模コードベースのリファクタリング	Claude Code（Opus 4.6）	SWE-bench Verified 80.9%で複雑な多ファイル改修に強い
ターミナル操作・CI/CDパイプライン構築	GPT-5.3-Codex（Perplexity経由）	Terminal-Bench 2.0で77.3%、ターミナル操作能力が最高峰
UIコンポーネントの素早い実装	ChatGPT（GPT-5.4）	美しいUI生成と高速なレスポンスで反復作業に向いている
競合分析・市場調査レポートの自動生成	Perplexity Computer	深いリサーチ能力と複数ソースの統合が得意
単純な質問への即時回答	Perplexity（無料版）	コストゼロで十分な品質が得られる

正直に言うと、Perplexity Computerは「何でも1つで完結させたい人」にとっての最良の選択肢ですが、「特定の用途での最高性能」を求めるなら専用ツールに軍配が上がる場面もあります。これは欠点というよりも、現時点でのAIエコシステム全体の成熟度の話です。2026年末には今の構図がまた変わっているでしょう。

Perplexity AIのコーディング活用で陥りやすい落とし穴

落とし穴①AIが書いたコードをそのまま本番にデプロイしてしまう

GPT-5.3-Codexが生成するコードは確かに高品質ですが、本番環境に即デプロイするのは禁物です。セキュリティの観点から、入力バリデーション、認証・認可の実装、SQLインジェクション対策、XSS対策などを人間がレビューする工程は省略できません。特にGPT-5.3-CodexはOpenAI自身が「サイバーセキュリティ領域でHigh能力」と分類したモデルです。これは攻撃的なコードを生成する能力も潜在的にあることを意味しており、生成コードが意図しないセキュリティホールを含む可能性は常にゼロではありません。

落とし穴②Perplexityを「検索ツール」として過小評価し続けている

日本のユーザーの多くは今もPerplexityを「ちょっと賢いGoogle」として使っています。でも2026年3月現在、Perplexity Computerは「研究・設計・コーディング・デプロイを一気通貫で行うデジタル作業員」に変貌しています。ツールの認識が古いままだと、「Perplexityで調べてからChatGPTでコードを書いて、GitHubは手動でプッシュする」という非効率なワークフローを続けることになります。

実際に使えば「あ、これ全部Perplexity Computerで完結できたんだ」という気づきが必ずあります。まずProプランのLabsモードで小さなプロジェクトを試してみることを強くすすめます。

ぶっちゃけこうした方がいい！

ここまでGPT-5.3-Codexサブエージェントの凄さ、Perplexityの使い方、落とし穴まで一通り話してきたので、最後に個人的な本音を言います。

「Perplexity Computerを月200ドル払って使うかどうか迷っている人」に向けて言うと、正直なところいきなりMaxプランに飛びつく必要はまったくありません。まずProプランの月20ドルで十分です。ProプランでもLabsモードが使え、GPT-5.4が使え、リアルタイム検索ができます。Computerの本当のパワーが必要になるのは「数十ステップにわたる複雑なプロジェクトを自動化したい」「毎日同じような複合タスクをAIに任せたい」「GitHubに自動プッシュまで含むCI/CDを構築したい」というはっきりとした用途が生じてからです。

そしてもっと大事なことを言います。どのプランを使うにしても、Perplexityの「リアルタイム検索＋コーディング」という組み合わせに、今すぐ慣れた方がいい。他のAIツールでは「知識カットオフ以前の情報しか出ない」という限界がある場面でも、Perplexityなら「今日の時点で最新の公式ドキュメントを参照したコード」が得られます。これは実務でコードを書く人間にとって、想像以上に価値が高いです。

特にライブラリの更新が激しいフロントエンド開発、頻繁にAPIの仕様が変わるサービス連携、Dockerや各種クラウドサービスの設定など、「今の仕様」が重要な領域では、Perplexityは他のどのAIよりも信頼できる作業パートナーになります。

個人的にはこうしたほうがぶっちゃけ楽だし効率的だと思っています。「Perplexityで最新情報を検索し、その検索結果をコンテキストに含めた上でGPT-5.3-Codexに実装させる」という一連のフローを、カスタムスキルとして一度登録してしまうことです。毎回「最新ドキュメントを参照して」と書かなくても、スキルに「常に最新の公式ドキュメントをリアルタイム検索してからコードを出力すること」と定義しておけば、以後は普通に依頼するだけで自動的にその手順が実行されます。

AIツールの性能差が縮まってきた今、勝負の分かれ目は「モデルのスペック」よりも「自分に合ったワークフローをどれだけうまく設計できるか」です。Perplexityのカスタムスキルは、その設計をAIに記憶させる仕組みそのものです。ここに一番時間を投資するのが、2026年現在で最もコスパが高いAI活用法だと、個人的には確信しています。

GPT-5.3-Codexサブエージェントに関する疑問解決

GPT-5.3-Codexサブエージェントは誰でも使えるの？

現時点では、GPT-5.3-Codexサブエージェントを搭載したPerplexity ComputerはMaxプランのサブスクライバー向け（月額200ドル）にて提供されています。Proプラン（月額20ドル）やEnterpriseプランへの展開も「近日中」と予告されていますが、具体的な日程は2026年3月時点では発表されていません。なお、GPT-5.4モデルについてはProおよびMaxプランの両方で利用可能になっています。まずはGPT-5.4を試しながら、Perplexity Computerの可能性を探ってみるのが現実的なスタートラインかもしれません。

プログラミング知識がなくても使いこなせる？

これがPerplexity Computerの核心的な価値提案です。従来のAIコーディングツールの多くは、Dockerのセットアップ、APIキーの管理、複数のターミナルウィンドウの操作など、相応の技術的知識を前提にしていました。しかしPerplexity Computerはブラウザにログインするだけで使え、すべての処理をサンドボックス環境の中で完結させます。「こういうアプリを作りたい」と日本語で伝えれば、GPT-5.3-Codexが実装を担当してくれます。ただし、生成されたコードのレビューや、意図とのズレの修正には最低限のコミュニケーション能力は必要です。AIはまだ完璧ではなく、特にセンシティブな処理や曖昧な仕様の場合は人間の確認と軌道修正が不可欠です。

GPT-5.3-CodexはGPT-5.4に置き換えられてしまったの？

技術的には、GPT-5.4がGPT-5.3-Codexのコーディング能力を継承しつつ、さらに多機能化した上位モデルに位置づけられます。しかし実務的には、GPT-5.3-CodexはTerminal-Bench 2.0において依然GPT-5.4を2.2ポイント上回っており、ターミナル操作が中心の重量級ワークフローでは独自の強みを持ち続けています。Perplexity Computerのサブエージェントとして機能する文脈では、タスクの性質に応じて最適なモデルが選択されるため、両モデルが共存して活躍するケースも今後増えていくと考えられます。

セキュリティ面は大丈夫？

OpenAIはGPT-5.3-Codexを、自社の「Preparedness Framework（準備態勢フレームワーク）」においてサイバーセキュリティ領域で「High（高）」能力に分類された初のモデルとして位置づけています。これはモデルの能力が高い分、潜在的なリスクも大きいことを意味しており、OpenAIはこれまでで最も包括的な安全対策スタックと組み合わせて提供しています。Perplexity Computer側でも、すべての処理を独自のサンドボックス内で完結させることで、デスクトップへの直接アクセスやピクセル監視といったリスクを排除する設計になっています。

まとめ

2026年3月6日のアップデートで実現したPerplexity ComputerへのGPT-5.3-Codexサブエージェント統合は、「AIが仕事をする」という概念を根底から変えるターニングポイントです。Terminal-Bench 2.0での77.3%、OSWorld-Verifiedでの64.7%という数値は、単なる数字の改善を超えて「AIが人間と同じ画面を見ながら、同じように操作できる」という段階への移行を示しています。

重要なのは、このシステムが19のモデルをオーケストレーションしながら、各タスクに最適なモデルを自動選択するという点です。Claude Opus 4.6とGPT-5.3-Codexが競合するのではなく、それぞれの強みを活かして協調するという構造が、Perplexity Computerの真の強みです。プログラミング経験がなくても、フルスタックアプリが作れる時代が、確実に、そして静かに、始まっています。まずはPerplexityのProプランから試してみて、GPT-5.4の実力を肌で感じながら、Maxプランへのアップグレードを検討する価値があるかどうかを判断してみてください。