跳转到内容

OpenAI Agents SDK 介绍

开源主页:https://github.com/openai/openai-agents-python

官方文档:https://openai.github.io/openai-agents-python/

官方示例代码:https://github.com/openai/openai-agents-python/tree/main/examples

2025年3月11日,OpenAI再次引爆业界,正式推出了全新的开发者工具,其中核心亮点便是全新开源的Agents SDK。这款SDK与全新的Responses API深度融合,共同为构建具备复杂任务处理能力的AI代理(Agent)提供了强大支持,标志着AI应用开发进入了一个全新阶段。

官方发布介绍视频

OpenAI的开源智能体编排框架Agents SDK

视频内容总结:

过去,开发AI智能体时,开发者通常需要自己拼凑不同的API,不仅麻烦,效率也低。OpenAI新推出的三个内置工具有效解决了这些痛点:

第一,Web Search工具,让AI智能体能够实时搜索网络,获取最新的事实信息,回答更准确。

第二,File Search工具,升级后支持元数据筛选和直接访问向量数据库,更好地利用企业或个人私有数据,轻松实现知识检索(RAG)功能。

第三,Computer Use工具,能控制电脑自动执行任务,甚至操作没有API的旧软件,实现复杂任务自动化。

OpenAI同时还推出了全新的Responses API,不仅能支持多轮对话,还能同时调用多个工具,简化复杂流程,提升效率。它将在未来逐步替代Assistant API(计划于2026年停止服务)。

此外,OpenAI的开源智能体编排框架Swarm现已正式升级为Agents SDK,更适合生产环境,支持智能体间的协作、任务交接、流程监控和追踪,开发者只需几行代码就能构建强大的多智能体系统。

AI超元域的介绍

链接:https://www.aivi.fyi/aiagents/introduce-agents-SDK

任务编排

在过去,开发者为了让AI能够自动执行多步骤任务,往往需要分别调用多个API并自行编写繁琐的协调逻辑。而全新的Agents SDK正是为了解决这一痛点而生。它采用开源多智能体工作流编排框架,能够轻松定义Agent角色和工具,支持单Agent和多Agent间的智能切换,让整个任务执行过程更高效、更安全。

Responses API

Responses API:整合多工具接口,打造高效基石

与Agents SDK配套的还有全新推出的Responses API。这款API融合了Chat Completions API的简洁性和Assistants API的工具调用能力,开发者仅需一次API调用,即可同时利用多种工具进行任务处理。内置的工具包括:

  • Web搜索工具:基于最新GPT-4o和GPT-4o-mini模型,实时抓取互联网数据,并提供清晰引用。
  • 文件搜索工具:通过向量存储和元数据过滤,快速从海量文档中检索关键信息。
  • 计算机使用工具:赋能Operator模型,实现鼠标、键盘等操作的自动化执行。
  • 这种一体化设计大大降低了开发门槛,让复杂的多步骤任务变得前所未有的简单。

Agent元年

虽然Agent是很早就有的概念,但从此以后才会大放光彩。

OpenAI此次工具集的发布不仅仅是技术上的突破,更预示着AI代理将成为各行各业提升生产力的重要工具。无论是客户支持自动化、多步研究、内容生成、代码审查还是销售线索挖掘,Agents SDK和Responses API都为开发者提供了灵活、可扩展的解决方案。

例如,在电商领域,开发者可以构建一个“个人造型师”Agent:首先通过文件搜索工具获取用户的穿衣偏好数据,再利用Web搜索工具推荐附近的商店,最后通过计算机使用工具完成在线购物下单。如此一来,从推荐到购买,再到售后服务,整个流程都能实现自动化协同,极大提升用户体验和运营效率。

正如OpenAI首席产品官Kevin Weil所言:“2025年将是AI智能体爆发的一年。”此次发布不仅回应了业界对智能体技术的期待,也展示了OpenAI在推动AI应用落地方面的坚定决心。随着更多企业和开发者借助这些新工具进行创新,我们有理由相信,未来的数字工作场景将因AI代理的广泛应用而焕发全新活力。

OpenAI的全新Agents SDK和Responses API无疑为AI代理的研发和部署开辟了一条全新且高效的道路。随着这些工具的普及,传统人工智能应用的边界将不断被突破,未来的工作模式也将因此发生深刻变革。

代码示例

链接里面有使用SDK的示例代码,可以详细看看。