在近日举办的第二十八届中国北京国际科技产业博览会上,一款能够“听懂”藏语并以藏语思维进行创作的大模型成为了全场关注的焦点。这款名为“DeepZang”的大模型由西藏大学研发团队深度参与开发,不仅展示了AI在多语言处理上的突破,更标志着少数民族语言正加速融入全球数字化浪潮。

长期以来,主流通用大模型多以中、英文为核心进行训练,在处理藏语等少数民族语言时,往往存在翻译腔重、语感生硬等“水土不服”的现象。为了打破这一僵局,研发团队收集了近 7000 万条藏汉平行语料,并采集了超过 30500 小时的语音数据,全面覆盖了卫藏、康巴、安多三大藏语方言区。

这款大模型的独特之处在于其“原语思维”能力。在科博会现场,它展现了极高的实用性:从起草牦牛买卖合同,到创作赞美父母的诗歌,再到提供专业的营养建议,AI的回答既精准又富有藏语独特的文化韵味。更值得一提的是,通过声纹识别与方言分类技术的结合,它有效解决了藏语口语方言差异大的沟通难题,即使文字水平不高的用户,也能通过语音轻松互动。

科技的进步直接转化为生产力的提升。在西藏山南从事翻译工作的洛桑顿玉表示,AI辅助翻译让原本需要三个人分工、耗时 40 分钟的稿件,现在单人仅需 20 多分钟即可完成。目前,“DeepZang”的用户量已突破 30 万,其中 18 至 40 岁的青年群体占比超七成,覆盖范围深入西藏、青海、四川、甘肃等偏远地区。

尽管表现亮眼,藏语AI的商业化之路仍面临算力成本高昂、资金压力大等挑战。对此,相关负责人表示,首次参加科博会正是希望寻找志同道合的合作伙伴,共同攻克算力与商业闭环难题。随着西藏全区5G网络和电力基础设施的完善,藏语AI有望在未来成为连接藏语使用者与现代数字世界的坚实桥梁。