【AIbase报道】尽管 OpenAI 正在全力推广其全新一代智能浏览器 ChatGPT Atlas,但公司内部安全主管 Dane Stuckey 近日却公开表达了对其潜在安全风险的担忧,引发业界关注。

Stuckey 指出,Atlas 面临的最大挑战之一是尚未彻底解决的 “即时注入”(Prompt Injection)攻击。这类攻击通过在网页、邮件或其他内容中巧妙嵌入恶意指令,从而诱导 AI 代理执行非预期操作。其影响不仅可能干扰用户的购买行为,还可能导致电子邮件内容或登录凭证等私人数据被窃取。

OpenAI

他坦言,尽管 OpenAI 已经开展了大规模安全测试,并在 Atlas 中引入多重防护机制与新的模型训练方法,但“即时注入”仍然是一个棘手的开放性问题,短期内难以彻底根除。

为缓解风险,OpenAI 在 Atlas 中部署了两项关键防御措施:其一是 “注销模式”,用于在必要时阻断 AI 代理对用户数据的访问,从源头防止信息泄露;其二是 “监视模式”,适用于敏感网站,要求用户在关键交互中进行人工确认和监督,以确保操作安全。

Stuckey 表示,团队正在加速研发更多防护功能与快速响应系统,以便在面对潜在攻击时能第一时间进行干预和修复。“Atlas 的安全挑战不仅是技术问题,更是人与 AI 协作的新边界测试。”他强调。