3月26日,
根据最新的

据
在生成式 AI 深度渗透内容创作领域的背景下,

3月26日,
根据最新的

据
在生成式 AI 深度渗透内容创作领域的背景下,
AMD发布vLLM-ATOM插件,专为大语言模型部署优化,在不改变现有工作流下,显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制,利用vLLM框架的高显存利用率优势,让开发者以低学习成本实现技术迁移,获得性能平滑升级。
谷歌安全团队首次发现黑客利用AI技术开发出可绕过主流管理软件的攻击工具,该工具利用“零日”漏洞实施攻击。此类漏洞因开发商未发现而无法提前修复,引发对网络安全新威胁的广泛关注。
苹果M4芯片普及推动本地AI发展,开发者jola在24GB内存的M4 MacBook Pro上成功部署本地AI工作流。测试显示,优化后的Qwen 3.5-9B模型生成速度达每秒40 tokens,为离线办公和私密开发提供高效方案。选型上,9B模型被认为是本地运行大语言模型的最优解,平衡了性能与资源需求。
生成式AI席卷编程领域之际,Zig开源项目逆势推出严格政策:全面禁止使用大语言模型生成的代码或评论参与贡献。知名开发者Simon Willison解读后,引发社区对技术效率与人才培养博弈的讨论。核心矛盾在于代码产出与人才成长的取舍,Zig维护者重新定义“贡献”,强调原创与学习过程。
大语言模型推理效率迎来突破。清华大学与Moonshot AI联合提出“预填充即服务”新架构,通过将推理过程拆分为预填充和解码两个阶段,并优化算力资源分配,有效解决硬件限制问题,显著提升模型服务性能。