据《华尔街日报》 1 月 14 日报道,韩国政府斥巨资推动的“本土大模型竞赛”陷入争议漩涡:五家决赛入围企业中,至少三家被指在其模型中使用了来自中国和美国公司的开源代码,包括智谱AI、阿里巴巴、OpenAI及DeepSeek等,引发关于“国产AI是否真正自主”的激烈辩论。
这场始于 2024 年 6 月的国家级项目,旨在三年内打造性能达到国际领先模型95%水平的纯韩国技术大模型,以减少对中美科技巨头的依赖,保障国家经济与安全利益。获胜者将获得政府提供的优质数据、人才资金及关键AI芯片使用权。然而,理想丰满,现实骨感——当技术全球化与开源协作成为行业常态,“从零造轮子”的自主路线显得愈发不切实际。
争议焦点集中于入围企业Upstage。竞争对手Sionic AI CEO高锡贤公开指控其模型部分模块与中国智谱AI的开源代码高度相似,甚至残留版权标记,质疑其“套壳中国模型却申领 taxpayer 资金”。尽管Upstage紧急召开直播发布会,展示完整训练日志证明核心模型为自研,并解释仅在推理框架(非训练核心)中使用了全球广泛采用的智谱开源组件,高锡贤随后道歉,但风波已起。
随后,Naver与SK电讯亦被卷入。Naver被指其视觉与音频编码器与阿里通义千问及OpenAI产品存在相似性;SK电讯则被发现推理代码与DeepSeek开源库雷同。两家公司均强调:模型的核心训练引擎完全自研,外部组件仅用于标准化的输入/输出处理,属于行业通用实践。
对此,学界观点两极。哈佛大学教授魏裕炎指出:“拒绝开源软件等于放弃技术红利,完全自研每一行代码既不现实也无必要。”首尔国立大学AI研究所所长李在武也证实,受质疑模型的核心参数训练过程确为从零开始,未直接复制外国模型权重。
然而,反对者担忧:即便仅使用外围代码,也可能引入潜在后门或依赖风险,削弱“主权AI”的战略意义。目前,韩国科学部尚未就竞赛规则中“是否允许使用外国开源代码”作出明确界定,但部长裴庆勋表示欢迎技术辩论,称“这正是韩国AI未来的光明所在”。
在全球加速构建“AI主权”的浪潮下,韩国困境折射出一个普遍难题:在高度互联的AI生态中,真正的“技术独立”边界究竟在哪里? 是代码逐行自研,还是核心算法与数据主权可控?这场风波或许没有简单答案,但它无疑为各国敲响警钟——AI自主化,远不止一场模型竞赛,而是一场涵盖技术伦理、产业政策与全球协作的系统性工程。
