随着人工智能进化速度远超行业预期,AI 安全领域的先驱
就业与经济变革:研究 AI 自动化对全球劳动力市场的重塑及应对机制。
威胁与防御韧性:防范 AI 技术被滥用于生物安全、网络攻击等高危领域,增强社会防御能力。
AI 价值观对齐:如何确保前沿 AI 系统的决策符合人类的伦理标准与社会公共利益。
自循环治理体系:探索 AI 在自我监督与自演化过程中的透明度与合规管理。
近期

随着人工智能进化速度远超行业预期,AI 安全领域的先驱
就业与经济变革:研究 AI 自动化对全球劳动力市场的重塑及应对机制。
威胁与防御韧性:防范 AI 技术被滥用于生物安全、网络攻击等高危领域,增强社会防御能力。
AI 价值观对齐:如何确保前沿 AI 系统的决策符合人类的伦理标准与社会公共利益。
自循环治理体系:探索 AI 在自我监督与自演化过程中的透明度与合规管理。
近期
Anthropic公司开发的Claude Mythos AI模型因网络安全能力过强而未公开发布,但遭黑客在测试期间非法获取。该事件凸显AI安全挑战,使注重安全的Anthropic陷入困境。
蚂蚁AI安全实验室对开源智能体框架OpenClaw进行安全审计,发现33个漏洞。最新版本已修复其中8个,包括1个严重、4个高危和3个中危漏洞。蚂蚁集团将持续关注其安全风险,支持AI智能体安全应用。
OpenAI收购初创公司Promptfoo,强化AI安全布局。这家成立于2024年的公司专注于AI应用评测与安全,拥有23人团队和35万开发者用户,估值达8600万美元。收购将帮助OpenAI弥补智能体安全方面的不足,应对AI智能体快速发展带来的安全挑战。
OpenAI收购Promptfoo,强化AI安全防线。此举旨在通过自动化工具,在开发早期检测并防止大模型产生错误或被恶意引导,确保AI技术的可靠与安全。
马斯克在法庭上指责OpenAI存在安全漏洞,称其xAI的Grok更安全,并暗示ChatGPT与自杀事件有关。庭审围绕2023年3月一封呼吁暂停AI开发的公开信展开。