宇树科技冲刺科创板IPO,百亿估值获阿里腾讯重金加持

苹果AI高管Ruoming Pang跳槽Meta,将加入其新成立的超级智能实验室,年薪数百万美元。Meta近期重组AI业务,由前Scale AI CEO Alexandr Wang领导新部门,并斥资290亿美元投资Scale AI。此举凸显科技巨头在AI领域的人才争夺战日趋激烈,Meta正通过高薪和战略投资加速布局。苹果和Meta均未对此事置评。
微软推出Azure AI Foundry新服务Deep Research公开预览版,这是一款类似OpenAI智能体的研究助手。它能自动分解复杂任务,通过必应搜索和GPT模型完成多轮信息检索与验证,生成可审计的研究报告。该服务适用于学术、金融、医疗等领域,支持API集成,显著提升研究效率。现已开放申请,开发者可将其自动化能力整合到自有应用中。
7月7日,百度AI团队宣布PaddleOCR3.1版本正式上线,在多语种识别、复杂文档翻译及大模型连接能力上实现三大升级。新版本支持37种语言的文本识别,平均精度提升超30%,并推出文档翻译产线与MCP服务器功能,助力开发者高效构建AI应用。 针对全球化场景下的多语言需求,PaddleOCR3.1新增PP-OCRv5多语种模型,覆盖法语、西班牙语、俄语等37种语言。通过融合文心4.5多模态大模型的视觉与文本理解能力,模型可自动完成高置信度文本检测与数据标注,解决多语种数据稀缺痛点。实测数据显示,新模型在拉丁语系及东斯
2024年8月,科大讯飞正式推出星火极速超拟人交互技术,通过端到端语音建模与多维度情感解耦训练,实现响应速度、情绪共鸣、语音可控表达三大核心突破。该技术可精准识别用户语音中的情感波动,以适配语气实时回应,并支持语速、音色、角色人设的动态调整,标志着语音交互从“功能实现”向“情感连接”的跨越式升级。 目前,超拟人交互API已正式上线讯飞开放平台,开发者可低成本调用技术能力。在游戏领域,NPC能根据玩家情绪动态调整对话策略;教育场景中,AI口语陪练可模拟外教真实反应;文旅行业则涌现出“数字导游”,通过角色扮演与游客深度互动。某景区试点显示,搭载该技术的导游AI使游客停留时长增加40%,二次消费率提升25%。
7月7日,腾讯混元3D团队宣布推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen,通过自研高压缩率表征BPT技术与自回归网格生成框架,实现了上万面复杂几何模型的精准生成。该模型突破性解决了3D资产生成中布线质量差、面数过高、后期编辑难等核心痛点,将美术师建模效率提升超70%,相关能力已上线腾讯混元3D AI创作引擎并集成至多款游戏管线。 传统3D生成算法虽能快速构建几何模型,但生成的网格面数过高(常达数十万面)、布线杂乱无章,导致模型美观度不足且难以直接应用于游戏开发。腾讯混元3D-PolyGen采用“网格序列化-自回归建模-序列解码”三步框架,将网格顶点和面片转化为离散Token序列进行空间推理,
微软推出"Deep Research"研究工具,整合Bing搜索与OpenAI技术实现研究自动化。该工具采用o3-deep-research核心技术,工作流程包含四个关键环节:首先通过GPT-4o/4.1与用户交互明确需求;其次调用Bing获取最新数据;然后进行智能分析推理;最终生成结构化报告,包含答案、推理过程、引用来源和澄清记录。该工具支持与Azure AI Foundry其他工具集成,适用于多领域深度研究,展现了微软在自动化研究领域的技术突破。