OpenAI推出ChatGPT智能体，生成式AI从“对话接口”迈向“行动接口”

作者：

文少

责任编辑：

刘沙

来源：

电脑商情在线

时间：

2025-07-18 15:40

关键字：

OpenAI ChatGPT 智能体生成式AI

　　当地时间7月18日凌晨，OpenAI发布“ChatGPT 智能体”（ChatGPT Agent），允许其语言模型在受控的云端虚拟机内执行多步骤任务，包括浏览网页、检索信息、运行代码、生成并下载可编辑的 PPT 或 Excel 文件。

　　该功能即日起向 ChatGPT Pro 订阅者开放，并计划在数日内扩展至 Plus 与 Team 级别，企业版及教育版将在未来几周跟进，欧洲与瑞士因监管审查暂未列入首批市场。

　　OpenAI 产品团队在官方博客中表示，新的交互范式将用户指令从“问答”升级为“任务委托”。在内部基准测试中，一项通常需要初级分析师 4–6 小时的财务数据整理与报告撰写流程，被压缩至 30 分钟以内完成。该效率提升得益于系统对两类前代工具的整合：今年 1 月发布的“Operator”侧重网页交互，2 月上线的“深度研究”专注长篇报告生成，二者能力在新智能体内被统一调度。

　　ChatGPT 智能体生成的 Office 格式文件可直接在 Microsoft 365 或 Google Workspace 中继续编辑，这使 OpenAI 与微软 Copilot 形成正面竞争。微软目前将 AI 能力深度绑定在自家生态，而 OpenAI 的方案允许跨平台调用，可能吸引希望在多云环境中部署 AI 工作流的企业客户。谷歌的 Slides 与 Sheets 尚未列入支持范围，OpenAI 称将在后续版本中评估集成可行性。

　　基准成绩显示，ChatGPT 智能体在“人类终极考试”综合评测中获得 44.4 分，在 FrontierMath 数学推理任务上准确率为 27.4%，在 SpreadsheetBench 表格操作测试中得分 45.5%，约为 Excel Copilot 的两倍。

　　OpenAI 研究人员指出，幻灯片排版与图表渲染仍处预览阶段，下一迭代将引入基于视觉反馈的微调模型以提升像素级对齐精度。

　　此次发布标志着生成式 AI 正从“对话接口”迈向“行动接口”。OpenAI 首席执行官 Sam Altman 在内部备忘录中写道：“当模型能够可靠地执行多步骤、跨应用任务时，我们就真正进入了软件自动化的新阶段。”