OpenAI API開発者体験が劇的進化:Responses API・Agents SDK・Codexの実践ガイド(2026年版)
はじめに:2025年はAPI開発の転換点
2025年は「単一モデルのローンチ」の年ではありませんでした。AIの本番運用が格段に簡単になった年です。
OpenAIはこの1年で、推論(Reasoning)の統合、マルチモーダルの第一級市民化、エージェント構築ブロックの整備、そしてCodexの成熟化を実現しました。本記事では、開発者の視点からこれらのアップデートを体系的に解説し、今日から使える実践的なコード例を提供します。
推論:別モデルから統一ラインへ
o1 → o3 → GPT-5.x への統合
2024年末に「推論」パラダイムが導入されて以来、推論モデルは別系列として進化してきました。o1、o3、o4-miniなどが、推論に時間をかけることで複雑タスクの信頼性を劇的に向上させました。
2025年後半からの大きなトレンドは収束です。推論の深さ、ツール使用、会話品質が単一のフラッグシップモデルラインに統合されました。開発者にとっては、コスト・レイテンシ・品質のトレードオフでモデルを選ぶようになり、異なるモデルファミリーからの選択ではなくなりました。
実践例:推論深度のチューニング
from openai import OpenAI
client = OpenAI()
# 複雑な推論タスク(high推論レベル)
response = client.responses.create(
model="gpt-5.2",
reasoning={
"effort": "high" # low / medium / high
},
input="次の分散システム設計の問題を分析してください...",
)
# シンプルなタスク(medium推論レベルで高速)
response = client.responses.create(
model="gpt-5.2",
reasoning={
"effort": "medium"
},
input="このコードのLintエラーを修正してください"
)
マルチモーダル:テキストだけの世界は終わった
画像生成
GPT Image 1シリーズは、画像生成をAPIの第一級機能にしました。
# GPT Image 1.5で画像生成
response = client.images.generate(
model="gpt-image-1.5",
prompt="青い空の下、桜並木の写真。春の午後の光"
)
# Responses API内でツールとして画像生成を使用
response = client.responses.create(
model="gpt-5.2",
input="このブログ記事のアイキャッチ画像を作成してください",
tools=[{"type": "image_generation"}]
)
音声・リアルタイムAPI
Realtime APIは一般提供(GA)となり、低レイテンシーの双方向音声ストリーミングが本番環境で利用可能です。
import asyncio
from openai import OpenAI
client = OpenAI()
async def voice_agent():
"""リアルタイム音声エージェントの実装例"""
async with client.audio.speech.create_stream(
model="gpt-4o-mini-tts",
voice="nova",
input="こんにちは、AIアシスタントです。何かお手伝いできますか?"
) as stream:
async for chunk in stream:
# ストリーミング再生
play_audio_chunk(chunk)
PDF・ドキュメント処理
PDF入力がAPIに追加され、ドキュメント中心のワークフローが直接構築可能になりました。
# PDFを直接アップロードして分析
with open("report.pdf", "rb") as f:
response = client.responses.create(
model="gpt-5.2",
input=[
{"type": "input_file", "filename": "report.pdf", "file_data": f.read()},
{"type": "message", "content": "このレポートの要約と重要ポイントを抽出してください"}
]
)
# URL経由でPDFを参照(アップロード不要)
response = client.responses.create(
model="gpt-5.2",
input=[
{"type": "file_url", "url": "https://example.com/report.pdf"},
{"type": "message", "content": "このドキュメントから主要な数値データを抽出してください"}
]
)
動画生成
Sora 2 & Sora 2 ProがVideo API(v1/videos)で公開され、動画もテキスト・画像・音声と並ぶ第一級モダリティになりました。
# 動画生成
response = client.videos.create(
model="sora-2",
prompt="桜の花びらが風に舞う映像。15秒間"
)
Codex:コーディングエージェントの完成形
GPT-5.2-Codex:コード特化モデル
GPT-5.2-Codexは、コード生成・レビュー・リポ規模の推論において最新のデフォルト選択です。別系列のモデルではなく、GPT-5ファミリー内で特殊化されています。
実用的な使い分け:
gpt-5.2-codex-medium: 一般的なタスクをワンショットで処理gpt-5.2-codex-high: 複雑な推論が必要なタスク(人間で数日かかる問題を数分で解決)
Codex CLI:ローカル環境でのエージェント開発
オープンソースのCodex CLIは、ローカルリポジトリでエージェント型のコーディングを可能にします。
# インストール
npm install -g @openai/codex
# プロジェクトで実行
codex "バグ#1234を修正して、テストを追加してください"
# 承認モードで安全に実行
codex --approval-mode suggest "リファクタリングを提案してください"
# MCP(Model Context Protocol)で外部ツールを統合
codex --mcp github-actions "CI/CDパイプラインを改善してください"
AGENTS.mdによるカスタマイズ
# AGENTS.md
## プロジェクト概要
Next.js 14 + TypeScript + Prismaを使用したECサイト
## コーディング規約
- ESLint + Prettierを必ず通すこと
- コンポーネントはServer Components優先
- API Routesは /api/v1/ 配下に配置
## テスト
- Vitestを使用
- カバレッジ80%以上
- PR前に必ずテストを実行
## 禁止事項
- any型の使用禁止
- console.logのコミット禁止
- 本番DBの直接操作禁止
Codex Cloud:クラウドベースの長時間セッション
CLIだけでなく、Codex Cloudは長時間のセッションと反復的な開発作業をサポートします。複数ファイルにわたる編集、デバッグ、計画を一つのセッションで処理できます。
エージェント構築:Responses API + Agents SDK + AgentKit
Responses API:マルチターン対応のエージェント構築
from openai import OpenAI
client = OpenAI()
# ツール付きエージェント
response = client.responses.create(
model="gpt-5.2",
instructions="あなたは顧客サポートエージェントです。丁寧に対応してください。",
input="注文の配送状況を確認したいです。注文番号はORD-12345です。",
tools=[
{
"type": "function",
"name": "check_order_status",
"description": "注文の配送状況を確認する",
"parameters": {
"type": "object",
"properties": {
"order_id": {"type": "string", "description": "注文番号"}
},
"required": ["order_id"]
}
}
]
)
Agents SDK:本番運用向けのエージェントオーケストレーション
from agents import Agent, Runner, function_tool
@function_tool
def get_weather(city: str) -> str:
"""指定された都市の天気を取得する"""
import requests
resp = requests.get(f"https://api.weather.com/v1/{city}")
return resp.json()["description"]
@function_tool
def search_restaurants(city: str, cuisine: str = None) -> list:
"""レストランを検索する"""
# 実装...
return results
# エージェントの定義
agent = Agent(
name="travel-assistant",
model="gpt-5.2",
instructions="旅行計画のアシスタントです。天気とレストラン情報を提供します。",
tools=[get_weather, search_restaurants]
)
# 実行
result = Runner.run(agent, "東京の週末の天気と、近くの和食レストランを教えて")
print(result.final_output)
品質管理:測定→改善→出荷のループ
Evals API
# Evalsによる体系的な品質評価
eval_result = client.evals.create(
model="gpt-5.2",
eval_name="customer-support-quality",
data="evals/customer_support_test_cases.jsonl",
grading_config={
"type": "custom",
"rubric": "回答が正確で、丁寧で、必要な情報を含む場合は1点"
}
)
強化学習ファインチューニング(RFT)
プログラマブルな評価基準(grader)を使用して、特定のタスク品質を向上させます。
知識蒸留(Distillation)
大規模モデルで検証したタスクを、より小さく安価なモデルに転移させます。
# 大規模モデルで品質を検証 → 小規模モデルに蒸留
# Step 1: GPT-5.2でプロンプトを最適化
# Step 2: 最適化したプロンプトでGPT-4o-miniをファインチューニング
# Step 3: コストを80%削減しつつ同等の品質を維持
コスト最適化の戦略
モデル選択ガイド
| ユースケース | 推奨モデル | 理由 |
|---|---|---|
| シンプルなテキスト処理 | GPT-4o-mini | 最安・高速 |
| 一般的な開発タスク | GPT-5.2 medium | バランス |
| 複雑な推論・コーディング | GPT-5.2 high | 最高品質 |
| コード特化タスク | GPT-5.2-Codex | コード最適化 |
| 画像生成 | GPT Image 1.5 | 最高品質 |
| 画像生成(低コスト) | GPT Image 1 mini | コスト効率 |
実践的なコスト削減テクニック
- キャッシング: 同じプレフィックスのリクエストで入力コストを50%削減
- ストリーミング: レイテンシ改善とUX向上
- バッチ処理: 非同期タスクで50%割引
- 蒸留: 大規模モデルの品質を小規模モデルに転移
まとめ
2025年のOpenAI APIアップデートは、開発者が「プロンプトを書く」ことから「エージェントを構築する」ことへの移行を加速させました。Responses API、Agents SDK、Codexという3本柱により、複雑なマルチステップのワークフローを本番運用可能な形で構築できるようになりました。
今日からできること:
- Responses APIに移行してマルチモーダル・ツール使用を活用する
- Codex CLIを導入して開発効率を向上させる
- Evalsを導入して品質管理の自動化を開始する
これらのツールを組み合わせることで、AI開発の新時代を切り拓くことができます。
関連リンク:
- OpenAI Developers Blog: https://developers.openai.com/blog/openai-for-developers-2025
- Codex CLI (GitHub): https://github.com/openai/codex
- OpenAI Platform Docs: https://platform.openai.com/docs

コメント