正文

英伟达发布 PersonaPlex-7B-v1:重塑实时语音交互的“全双工”黑科技

aibase

发布于AI新闻资讯

发布时间 :2026年1月19号 11:49

阅读 :1分钟

英伟达研究团队近日正式发布了名为 PersonaPlex-7B-v1 的全双工语音对语音对话模型。这款模型彻底打破了传统 AI 语音助手“听一句、回一句”的呆板模式，旨在实现更接近真人的自然对话体验。

与过去需要通过 ASR（语音转文本）、LLM(大语言模型)、TTS(文本转语音)多个环节串联的架构不同，PersonaPlex采用了一个单一的 Transformer 架构，直接完成语音理解与生成的全过程。AIbase 了解到，这种“端到端”的设计极大降低了响应延迟，并赋予了 AI 处理自然中断、语音重叠以及即时反馈的能力。简单来说，就像真人聊天一样，AI 在说话的同时也在持续倾听，即便用户突然打断，它也能迅速做出反应。

此外，该模型在个性化控制方面表现卓越。通过“语音+文本”的双重引导，用户不仅能定义 AI 的角色背景，还能精确控制其音色和语调。AIbase 获悉，英伟达在训练中结合了海量真实通话数据与合成场景，使模型既具备自然的语言习惯，又能严格遵守特定行业的业务规则。目前的评估结果显示，PersonaPlex-7B-v1在对话流畅度和任务达成率上均优于多数开源及闭源系统。

研究:https://research.nvidia.com/labs/adlr/personaplex/

划重点:

🎙️ 全双工交互: PersonaPlex-7B-v1支持实时语音流处理，允许用户在 AI 说话时随时插话或重叠对话，实现极速响应。
🧠 单模型架构: 舍弃了繁琐的插件式管道，采用单一Transformer结构同步预测文本和语音标记，从底层提升对话自然度。
🎭 深度个性化: 支持高达200token 的系统提示词及特定的语音嵌入，可灵活定制 AI 的角色性格、业务知识及情感音色。

相关推荐

Anthropic 进军印度：前微软高管领军，班加罗尔成 AI 扩张新前哨

美国AI公司Anthropic任命前微软高管Irina Ghose为印度区负责人，将在班加罗尔设立办公室。印度是Anthropic旗下Claude的第二大市场，此举旨在加速其商业化进程。

2026年1月19号 17:54

京东京造AI玩具覆盖全龄段！“唠唠鹦”陪老人听戏、“球球墨墨”解职场焦虑，AI陪伴进入家庭刚需时代

京东京造推出第二批自研AI玩具，覆盖儿童、青年和老年全年龄段，使AI陪伴从儿童专属扩展为家庭刚需。产品包括会讲方言的智能鹦鹉、懂情绪的桌面玩伴及健康守护者，以柔软方式融入家庭生活，满足不同群体的情感需求。

2026年1月19号 17:04

从 OpenAI 办公室诞生的独角兽：Chai Discovery 携手礼来开启 AI 制药新纪元

初创公司Chai Discovery与礼来合作，利用其AI算法Chai-2加速抗体药物研发。公司创始人来自OpenAI，获CEO支持，展现AI与生物医药融合潜力。

2026年1月19号 15:13

营收与算力双爆发！OpenAI 首席财务官揭秘：三年狂涨十倍的增长逻辑

OpenAI首席财务官回应外界质疑，强调公司过去三年在技术、商业变现和基础设施上实现“十倍级”增长。算力资源从2023年的0.2GW增至2025年的1.9GW，增长约9.5倍，收入增速与算力扩张基本同步。

2026年1月19号 14:55

全线翻车？多款顶尖AI大模型竟算不清“明年是哪一年”

多家顶尖AI模型在回答“2027年是不是明年”时集体出错，谷歌AI搜索摘要甚至错误地声称当前是2026年，将2027年误判为“去年”。这一常识性错误暴露了AI在基础逻辑判断上的局限性，引发业界对当前AI技术可靠性的讨论。

2026年1月19号 14:14

AIBase

智启未来，您的人工智能解决方案智库

© 2026AIBase 备案号：闽ICP备08105208号-24