エンジニアリング - ENGINEERING -

エンジニアリング

2025/3/12 [WED]

OpenAI、新API「Responses API」と「Agents SDK」を発表――AIエージェント開発を加速

OpenAIは2025年3月11日（米国時間）、開発者や企業向けに、AIエージェントの開発を支援する新たなツール群を[発表]{target=“_blank”}した。今回の発表では、従来のAPIを進化させた「Responses API」と、複数のエージェントを連携・管理する「Agents SDK」が中心となる。これにより、AIエージェントの開発が大幅に簡素化され、実用的なユースケースでの導入の加速が期待されるという。 ## Responses API：複雑なタスクをシンプルに処理 Responses APIは、従来のChat Completions APIとAssistants APIを統合した新しいAPI基盤である。1回のAPI呼び出しで、以下のような複数のツールを活用し、マルチステップのタスクを簡単に処理できる。 - Web検索：最新の情報をリアルタイムで取得し、引用付きで回答を生成 - ファイル検索：大量のドキュメントから関連情報を抽出 - コンピュータ操作：ブラウザやGUIアプリケーションをAIが直接操作し、業務を自動化特にWeb検索機能では、GPT-4oおよびGPT-4o miniを使用し、情報の正確性を測るSimpleQAベンチマークでそれぞれ90%、88%の高スコアを達成。これは、検索機能を持たないGPT-4.5の63%を大きく上回る結果となっている。 ![responce api simpleqa.jpg] :::small 画像の出典：[OpenAI]{target=“_blank”} ::: Responses APIは、標準のトークンおよびツール使用料金で提供され、既存のAssistants APIの完全な後継として、2026年半ばにはAssistants APIが廃止される予定だという。 ## Agents SDK：エージェントの連携と管理を強化 Agents SDKは、従来の「Swarm」フレームワークの後継となるオープンソースツールで、エージェントのワークフロー管理やオーケストレーションを簡素化する。主な特徴は以下の通り： - エージェントの設定：事前に指示を与えたLLM（大規模言語モデル）をエージェントとして定義可能 - タスクのハンドオフ：異なるエージェント間で処理を自動的に引き継ぐ仕組み - ガードレール：エージェントの出力を検証し、安全性と品質を確保 - トレーシングと可視化：エージェントの処理状況を可視化し、デバッグや最適化を容易にこのSDKを活用すれば、カスタマーサポート、コンテンツ生成、業務自動化など、複雑なワークフローを持つAIエージェントの開発が容易になる。たとえば、企業が導入するAIアシスタントが、初期対応エージェントが顧客の問い合わせを受け、専門的な質問を別のエージェントに引き継ぐといった高度な処理を実現できるという。 Agents SDKは、OpenAIのモデルだけでなく、AnthropicやGoogleのLLM、オープンソースモデル（DeepSeek、Qwen、Mistral、Llamaなど）とも互換性がある。開発者は既存のAIインフラを活用しながら、より高度なエージェントシステムを構築できるとのこと。 @[YouTube] ## 今後の展望 Responses APIとAgents SDKのリリースにより、OpenAIは開発者がより高度なAIエージェントを構築できる環境を提供した。Web検索やファイル検索を活用した情報収集、コンピュータ操作を含む自動化タスクの実行が可能となり、企業の業務効率化が加速すると期待される。 OpenAIはこれらのツールを「AIエージェント開発の第一歩」と位置づけており、今後も新たな機能を追加する予定だ。特に、Responses APIが既存のAssistants APIを代替することで、開発の柔軟性が向上し、AIエージェントの普及がさらに進むと見られる。 :::box [関連記事：OpenAI、AIエージェント「Operator」をProユーザーに提供開始　 Plusユーザーには「Deep Research」機能を月10回まで提供拡大] ::: :::box [関連記事：OpenAI、フリーランスエンジニアの実案件に基づく新AIベンチマーク「SWE-Lancer」を発表 – 最新LLMは総額100万ドルの案件のうち30～40万ドル分のみ完了] ::: :::box [関連記事：AIエージェントとは｜マニアックなプロンプトエンジニアリングはいらない注目の生成AI活用トレンド]{target=“_blank”} :::

エンジニアリング - ENGINEERING -

OpenAI、新API「Responses API」と「Agents SDK」を発表――AIエージェント開発を加速

OpenAI、フリーランスエンジニアの実案件に基づく新AIベンチマーク「SWE-Lancer」を発表 – 最新LLMは総額100万ドルの案件のうち30～40万ドル分のみ完了

生成AIを活用した課題解決─研修を経て挑んだ実践的提案｜コンテストレポート

日本語精度が高いと評判の「Qwen2.5」 日本市場への適用方法は

チューリング、600万フレームの世界最大規模データセットを公開 自動運転研究と開発の標準化戦略に向けた布石

企業の実環境でのLLMのSQL生成(Text-to-SQL)能力を評価する新ベンチマーク：Spider 2.0 GoogleDeepMindなどの研究チームが発表

日本、生成AIプロジェクトで世界9位、2028年には7位に上昇か GitHub年次レポート「Octoverse 2024」発表

Anthropic、AIシステムと外部データソースを統合する「Model Context Protocol」を発表

AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定 従来の手法では検出困難

Googleの新規コードの25%以上がAI生成—ピチャイCEO、第3四半期決算でAI活用による生産性向上を強調

AWS、生成AIを活用したアシスタント機能「AWS re:Post Agent」を発表：クラウド開発者向け技術支援を強化

富士通が日本語特化の大規模言語モデル「Takane」の提供を開始

テックファーム デジタルヒューマン×生成AIで感情をリアルタイム推定するアバターシステムを開発 認知症予防や介護の負担軽減など様々な分野への導入を目指す

OpenAI、新API「Responses API」と「Agents SDK」を発表――AIエージェント開発を加速

OpenAI、フリーランスエンジニアの実案件に基づく新AIベンチマーク「SWE-Lancer」を発表 – 最新LLMは総額100万ドルの案件のうち30～40万ドル分のみ完了

生成AIを活用した課題解決─研修を経て挑んだ実践的提案｜コンテストレポート

日本語精度が高いと評判の「Qwen2.5」 日本市場への適用方法は

チューリング、600万フレームの世界最大規模データセットを公開 自動運転研究と開発の標準化戦略に向けた布石

企業の実環境でのLLMのSQL生成(Text-to-SQL)能力を評価する新ベンチマーク：Spider 2.0 GoogleDeepMindなどの研究チームが発表

日本、生成AIプロジェクトで世界9位、2028年には7位に上昇か GitHub年次レポート「Octoverse 2024」発表

Anthropic、AIシステムと外部データソースを統合する「Model Context Protocol」を発表

AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定 従来の手法では検出困難

Googleの新規コードの25%以上がAI生成—ピチャイCEO、第3四半期決算でAI活用による生産性向上を強調

AWS、生成AIを活用したアシスタント機能「AWS re:Post Agent」を発表：クラウド開発者向け技術支援を強化

富士通が日本語特化の大規模言語モデル「Takane」の提供を開始

テックファーム デジタルヒューマン×生成AIで感情をリアルタイム推定するアバターシステムを開発 認知症予防や介護の負担軽減など様々な分野への導入を目指す

日本語精度が高いと評判の「Qwen2.5」　日本市場への適用方法は

チューリング、600万フレームの世界最大規模データセットを公開　自動運転研究と開発の標準化戦略に向けた布石

企業の実環境でのLLMのSQL生成(Text-to-SQL)能力を評価する新ベンチマーク：Spider 2.0　GoogleDeepMindなどの研究チームが発表

日本、生成AIプロジェクトで世界9位、2028年には7位に上昇か　GitHub年次レポート「Octoverse 2024」発表

AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定　従来の手法では検出困難

テックファーム　デジタルヒューマン×生成AIで感情をリアルタイム推定するアバターシステムを開発　認知症予防や介護の負担軽減など様々な分野への導入を目指す

日本語精度が高いと評判の「Qwen2.5」　日本市場への適用方法は

チューリング、600万フレームの世界最大規模データセットを公開　自動運転研究と開発の標準化戦略に向けた布石

企業の実環境でのLLMのSQL生成(Text-to-SQL)能力を評価する新ベンチマーク：Spider 2.0　GoogleDeepMindなどの研究チームが発表

日本、生成AIプロジェクトで世界9位、2028年には7位に上昇か　GitHub年次レポート「Octoverse 2024」発表

AIが未発見のバグを検出 ─ GoogleがSQLiteにおける脆弱性をAI技術で特定　従来の手法では検出困難

テックファーム　デジタルヒューマン×生成AIで感情をリアルタイム推定するアバターシステムを開発　認知症予防や介護の負担軽減など様々な分野への導入を目指す