据 AIbase 报道,xAI 正式发布了 Grok 语音代理 API,以每分钟仅 0.05美元的极具竞争力价格,在实时语音 AI 领域掀起了性能与性价比的双重风暴。该模型在音频推理基准测试中高居榜首,凭借不足1秒的首音延迟,实现了比竞品快近5倍的响应速度。
技术上,Grok 语音代理不仅支持包括中文在内的数十种语言自动检测与自由切换,更深度集成了实时网页搜索与推理能力,使其回复能够紧跟全网最新资讯。通过支持外部工具调用、情绪控制及多种语音选项,开发者可以构建出极具表现力且能执行实际任务的 AI 智能体。
值得一提的是,该 API 完全兼容 OpenAI 实时 API 规范,这为追求高性能、低成本方案的开发者提供了无缝迁移的可能,标志着马斯克在实时对话 AI 赛道上正式迈出了挑战行业格局的关键一步。
