ChatGPT Agent功能已全面向所有Plus、Pro和Team用户开放。此前,该功能已于7月17日开始向Pro用户逐步推出,并于近日完成对Plus和Team用户的全面覆盖。这一全新AI工具的推出,标志着ChatGPT从传统的对话助手迈向更具自主性的智能代理,为用户带来前所未有的任务自动化体验。

ChatGPT Agent:从对话到行动的突破

ChatGPT Agent是OpenAI最新推出的统一代理系统,整合了此前Operator的网站交互能力和Deep Research的网页信息综合能力,并结合ChatGPT的对话智能。这一系统能够在虚拟计算机环境中自主完成复杂任务,例如浏览网页、运行代码、生成可编辑文档等。用户只需通过自然语言描述需求,Agent便可主动选择最佳工具,执行从研究到操作的多步骤工作流。

与传统聊天机器人不同,ChatGPT Agent不仅能提供答案,还能直接采取行动。例如,它可以根据用户日历总结会议安排、为企业分析竞争对手并生成演示文稿,甚至帮助规划旅行或在线购物。这一功能的推出,使ChatGPT从单纯的知识查询工具升级为能够“代劳”复杂任务的智能助手。

image.png

核心功能:多工具协同与用户控制

ChatGPT Agent的核心优势在于其多工具协同能力。它配备了以下关键工具:

  • 视觉浏览器:模拟人类操作,通过图形界面浏览网页,点击按钮、填写表单。
  • 文本浏览器:适用于快速查询和信息提取,效率更高。
  • 终端与API访问:支持运行代码、调用第三方API,适合编程和数据处理任务。
  • 连接器:可连接Gmail、Google Drive、GitHub等应用,提取用户数据以提供个性化响应。

值得注意的是,ChatGPT Agent始终强调用户控制。系统会在执行敏感操作(如发送邮件或提交表单)前请求用户确认,并支持随时中断或接管任务。此外,OpenAI为防止“提示注入”攻击等安全风险,加入了多重保护措施,包括始终在线的分类器、拒绝高风险指令的训练以及“观察模式”,确保用户数据安全。

分层推出与使用限制

ChatGPT Agent目前仅对Plus(20美元/月)、Pro(200美元/月)和Team计划用户开放,Enterprise和Edu用户预计将在未来几周内获得访问权限。Pro用户每月可使用400条Agent消息,而Plus和Team用户则为40条,额外使用需通过信用额购买。

由于高需求,OpenAI曾推迟Plus和Team用户的上线时间,但截至7月24日,全球范围内的Plus、Pro和Team用户已全部解锁该功能。欧洲经济区(EEA)和瑞士的用户也在7月22日获得完整访问权限。

需要注意的是,ChatGPT Agent暂不支持记忆功能,以避免潜在的数据泄露风险。OpenAI表示,未来可能在完善安全措施后重新引入此功能。

性能表现:超越人类的潜力

OpenAI宣称,ChatGPT Agent在多项基准测试中表现出色。例如,在数据科学任务基准“DSBench”中,Agent显著超越人类表现;在网页导航基准“BrowseComp”中,其得分达到68.9%,较Deep Research提升17.4个百分点;在处理电子表格的“SpreadsheetBench”中,得分45.5%,远超微软Co pilot的20%。这些数据表明,ChatGPT Agent在处理复杂任务时已具备媲美甚至超越人类的潜力。

应用场景:从个人到企业的多维助力

ChatGPT Agent的应用场景广泛,覆盖个人和企业需求:

  • 个人用户:可用于规划旅行、购物、总结文档或管理日程。例如,Agent能根据用户邮件和日历安排婚礼行程,挑选礼物并查找附近酒店。
  • 企业用户:可自动化生成财务模型、竞争分析报告或演示文稿,显著提升工作效率。
  • 开发者:通过终端和API访问,Agent可运行代码、分析数据集,助力编程和数据处理任务。

尽管Agent表现出色,其速度和稳定性仍需优化。测试中,部分任务可能耗时15至30分钟,且在处理金融交易等高风险操作时存在限制,无法直接执行付款或账户操作。OpenAI表示,这是有意为之,以确保安全性和用户控制。

ChatGPT Agent的推出不仅是OpenAI产品线的一次重大升级,也反映了AI行业向“代理化”发展的趋势。与传统的生成式AI相比,Agent更像是一位“数字助手”,能够理解意图、规划步骤并执行任务。这种能力不仅提升了用户体验,也为企业自动化流程开辟了新可能。

然而,AI代理的广泛应用也带来了隐私和安全挑战。OpenAI在ChatGPT Agent中引入的严格安全措施,表明其对潜在风险的重视。未来,随着技术的成熟,AI代理可能在更多领域取代重复性劳动,但如何平衡自主性与用户控制,仍是行业需要解决的关键问题。

AIbase认为,ChatGPT Agent的全面上线标志着AI从“回答者”向“执行者”的转型。无论是个人用户还是企业团队,这一功能的普及都将推动生产力的进一步提升。OpenAI的持续迭代和优化,将决定其能否在竞争激烈的AI市场中保持领先。