OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁

【AIbase报道】尽管 OpenAI 正在全力推广其全新一代智能浏览器 ChatGPT Atlas，但公司内部安全主管 Dane Stuckey 近日却公开表达了对其潜在安全风险的担忧，引发业界关注。

Stuckey 指出，Atlas 面临的最大挑战之一是尚未彻底解决的 “即时注入”（Prompt Injection）攻击。这类攻击通过在网页、邮件或其他内容中巧妙嵌入恶意指令，从而诱导 AI 代理执行非预期操作。其影响不仅可能干扰用户的购买行为，还可能导致电子邮件内容或登录凭证等私人数据被窃取。

OpenAI

他坦言，尽管 OpenAI 已经开展了大规模安全测试，并在 Atlas 中引入多重防护机制与新的模型训练方法，但“即时注入”仍然是一个棘手的开放性问题，短期内难以彻底根除。

为缓解风险，OpenAI 在 Atlas 中部署了两项关键防御措施:其一是 “注销模式”，用于在必要时阻断 AI 代理对用户数据的访问，从源头防止信息泄露;其二是 “监视模式”，适用于敏感网站，要求用户在关键交互中进行人工确认和监督，以确保操作安全。

Stuckey 表示，团队正在加速研发更多防护功能与快速响应系统，以便在面对潜在攻击时能第一时间进行干预和修复。“Atlas 的安全挑战不仅是技术问题，更是人与 AI 协作的新边界测试。”他强调。

拖更三年万字长文，前OpenAI安全VP翁荔拆解Scaling Laws：你的模型可能喂错了数据

翁荔回归万字长文《Scaling Laws， Carefully》拆解大模型规模定律，直指行业共识可能写反：从Kaplan到Chinchilla，主流数据配比未必最优。文章细究算力、模型大小与数据量的权衡，暗示数百亿美元押注的路径或需彻底反思，引发从业者重新审视预训练配方的有效性。

小鹏机器人架构迎来重大调整，何小鹏亲自下场直管促量产

小鹏机器人中心近期完成深度重组，新设九个二级部门。创始人何小鹏继兼任中心负责人后，又亲自担任产品部负责人，直接听取汇报，实现对核心产品线的高度集权与深度参与，标志机器人业务正式进入其亲身操盘的战略推进期。

钉钉“悟空”获全球首个AI管理体系国际认证，AI治理迈入标准化新阶段