在AI语音客服领域的一个关键技术障碍——延迟和不自然的对话体验,终于被打破。人工智能电话支持公司 Phonely、推理优化平台 Maitai 以及芯片制造商 Groq 三方联合,打造出一套可实时切换模型、响应快如人类的电话AI系统,推动语音AI进入“拟人新纪元”。
据披露,通过此次合作,Phonely 的响应速度提升超过70%,AI对话准确率从81.5% 提升至99.2%,超越 GPT-4o 的94.7% 基准。这一成果来源于 Groq 的“零延迟 LoRA 热插拔”技术,通过 Maitai 的动态编排平台,可在多个微调模型间无缝切换,无需重新训练,也不会增加延迟。
Groq 的芯片专为语言推理设计,其 LPU(语言处理单元)与流式架构、高速片上内存等技术,使得模型能在亚秒级内响应。“首个响应令牌时间”由661ms 降至176ms,整体完成时间从1,446ms 缩短至339ms,AI电话几乎无法与真人区别。
Phonely CEO Will Bodewes 表示:“70%以上的用户无法分辨我们系统里是 AI 还是人类。延迟感曾是最明显的标志,如今已几近消失。”
效果显著,仅本月 Phonely 就帮助一家客户替换掉了350位人工坐席。得益于快速部署能力,企业无需改动API即可在一天内完成迁移上线,并在一周内看到性能飞跃。
这场合作不仅提升了客户服务体验,也象征着企业AI趋势的转变:从追求“大而全”的通用大模型,走向更快、更准、更灵活的多模型微调系统。Maitai 创始人 Christian DalSanto 表示:“我们相信企业AI的未来,将由专用模型组成的精细系统主导,而不是孤立的单一巨兽。”
对于企业而言,这不仅仅是性能的提升,更是成本结构的颠覆。无须排班、培训和管理庞大的客服团队,AI客服成为更优解。而 Groq 与 Maitai 提供的低延迟、高可控的架构,也为 AI 在保险、法律、汽车等领域大规模部署扫清了障碍。
此番突破证明,技术“恐怖谷”并非无法跨越。Phonely、Groq 与 Maitai 的合作不仅为语音AI提供新范式,也预示着传统客户支持产业即将面临剧烈转型。语音AI的时代,已经提前到来。