OpenAI推出ChatGPT智能体,生成式AI从“对话接口”迈向“行动接口”
文少
责任编辑:刘沙
电脑商情在线
时间:2025-07-18 15:40
OpenAI ChatGPT 智能体 生成式AI
当地时间7月18日凌晨,OpenAI发布“ChatGPT 智能体”(ChatGPT Agent),允许其语言模型在受控的云端虚拟机内执行多步骤任务,包括浏览网页、检索信息、运行代码、生成并下载可编辑的 PPT 或 Excel 文件。
该功能即日起向 ChatGPT Pro 订阅者开放,并计划在数日内扩展至 Plus 与 Team 级别,企业版及教育版将在未来几周跟进,欧洲与瑞士因监管审查暂未列入首批市场。
OpenAI 产品团队在官方博客中表示,新的交互范式将用户指令从“问答”升级为“任务委托”。在内部基准测试中,一项通常需要初级分析师 4–6 小时的财务数据整理与报告撰写流程,被压缩至 30 分钟以内完成。该效率提升得益于系统对两类前代工具的整合:今年 1 月发布的“Operator”侧重网页交互,2 月上线的“深度研究”专注长篇报告生成,二者能力在新智能体内被统一调度。
ChatGPT 智能体生成的 Office 格式文件可直接在 Microsoft 365 或 Google Workspace 中继续编辑,这使 OpenAI 与微软 Copilot 形成正面竞争。微软目前将 AI 能力深度绑定在自家生态,而 OpenAI 的方案允许跨平台调用,可能吸引希望在多云环境中部署 AI 工作流的企业客户。谷歌的 Slides 与 Sheets 尚未列入支持范围,OpenAI 称将在后续版本中评估集成可行性。
基准成绩显示,ChatGPT 智能体在“人类终极考试”综合评测中获得 44.4 分,在 FrontierMath 数学推理任务上准确率为 27.4%,在 SpreadsheetBench 表格操作测试中得分 45.5%,约为 Excel Copilot 的两倍。
OpenAI 研究人员指出,幻灯片排版与图表渲染仍处预览阶段,下一迭代将引入基于视觉反馈的微调模型以提升像素级对齐精度。
此次发布标志着生成式 AI 正从“对话接口”迈向“行动接口”。OpenAI 首席执行官 Sam Altman 在内部备忘录中写道:“当模型能够可靠地执行多步骤、跨应用任务时,我们就真正进入了软件自动化的新阶段。”