相关推荐
智谱 AI 输入法全新发布,语音识别技术同步开源!
智谱AI推出GLM-ASR系列开源语音识别模型,并发布桌面端“智谱AI输入法”,提升PC语音输入体验。其中GLM-ASR-2512云端模型支持实时转写,在复杂环境中表现优异,字符错误率(CER)极低。
2025年12月10号 11:11
179.8k
美国监狱电话隐私大曝光:囚犯通话竟成 AI 训练材料
美国Securus公司被曝秘密利用监狱通话记录开发AI模型,数据来源广泛,包括地方监狱、移民拘留中心等,旨在实现实时分析。
2025年12月8号 15:16
146.2k
豆包输入法正式上线 深度整合AI,支持复杂语境智能预测与离线使用
字节跳动推出“豆包输入法”,安卓版已上线,iOS版即将发布。它基于豆包App语音模型,提升语音识别、语义理解和键盘输入效率,支持方言、英语及中英混合输入,适应轻声、快语和嘈杂环境,核心功能是语音后自动纠错。
2025年11月25号 10:01
269.9k
科大讯飞发布AI软硬一体方案:在90分贝噪声中也能精准识别
科大讯飞在2025年1024开发者节发布AI软硬一体解决方案,通过算法与硬件深度融合,解决了高噪声、远场等复杂环境下的识别难题,提升了语音与视觉智能的精准度,标志着该领域的重要突破。
2025年11月6号 14:10
162.0k
阿里通义推出 Qwen3-ASR-Toolkit,实现音视频转录新突破
阿里通义Qwen团队推出开源Python命令行工具Qwen3-ASR-Toolkit,支持便捷音视频转录。该工具突破Qwen3-ASR-Flash API的三分钟限制,实现小时级快速转录,为大规模音频处理提供有力支持。Qwen3-ASR-Flash是最新语音识别模型,基于海量多模态数据训练。
2025年9月24号 9:50
175.1k
