AI新闻资讯
xAI重磅发布Grok Voice Agent API:每分钟仅0.05美元,音频推理基准登顶第一!
xAI推出Grok Voice Agent API,向全球开发者开放实时语音交互能力。该API基于成熟的语音技术栈,已在特斯拉车辆和移动应用中广泛应用。其最大亮点是极致性价比,每分钟连接费用仅0.05美元,显著低于市场主流竞品,助力开发者低成本构建高性能语音应用。
刚刚
6.9K
字节跳动推出 TRAE CN 企业版,助力高效编程
字节跳动发布AI编程工具TRAE CN企业版,内部超92%工程师使用,个人版用户超600万。数据显示,该工具在抖音生活服务团队AI代码贡献率达43%,显著提升效率。企业版针对性能、部署适配、效能追踪及代码安全等需求优化。
刚刚
6.4K
xAI 推最快语音代理 API,支持中文实时搜索与情绪控制
xAI发布Grok语音代理API,每分钟仅0.05美元,性价比极高。该模型在音频推理基准测试中表现最佳,首音延迟不到1秒,响应速度比竞品快近5倍。支持包括中文在内的数十种语言自动检测与切换,并集成实时网页搜索与推理能力,提升回复质量。
刚刚
4.9K
Gemini3Flash 正式面向 Perplexity Pro 与 Max 用户开放
Perplexity AI平台于12月18日宣布,其Pro和Max订阅用户现已全面接入谷歌最新轻量级模型Gemini3Flash。该模型主打低延迟与高吞吐,在保持强大语言理解能力的同时,显著优化了推理成本和响应速度。此次更新旨在为用户提供更快速、流畅的搜索体验,标志着平台在提升响应效率方面迈出关键一步。
刚刚
5.5K
微软开源 TRELLIS.2:一键将图片转为高精度 3D 模型
微软开源图像转3D工具TRELLIS.2,仅需一张图片即可快速生成带材质的3D模型,输出.glb格式文件,兼容Blender、Unity等平台。该工具采用4B模型,支持512³至1536³分辨率图像处理,在NVIDIA H100显卡上,生成512³模型仅需约3秒。
刚刚
7.5K

火山引擎发布 AI 节省计划,豆包大模型最高降价47%
火山引擎发布多项AI更新,豆包视觉模型升级,Seedream4.5增强图像创作功能,Seedance1.5Pro推出视频生成模型,加速企业AI普惠。
刚刚
5.4K
火山引擎FORCE大会亮剑:豆包大模型1.8+Seedance 1.5 Pro发布,日均50万亿Tokens登顶中国第一
字节跳动在火山引擎大会上发布豆包大模型1.8和视频生成模型Seedance 1.5 Pro,并推出“AI节省计划”以降低企业成本。豆包大模型在推理、多语言等方面显著提升,Seedance则优化了视频生成质量与时长。
刚刚
5.9K
ChatGPT正式上线App Directory:Spotify、Apple Music、DoorDash入驻,AI平台迈向“万事通”生态
OpenAI升级ChatGPT,推出“应用目录”整合第三方工具,用户可在聊天界面直接调用服务。同时开放开发者SDK,支持外部团队构建深度集成体验,向成熟AI平台迈进。
刚刚
5.2K

最新AI日报
#1
OpenAI确认ChatGPT"成人模式"时间表:2026年Q1推出
#2
蚂蚁开源 LLaDA2.0,业内首个100B 参数规模的扩散语言模型
#3
国产大模型“抢滩”港股:MiniMax、智谱、月之暗面竞逐“AI第一股”
#4
Skywork APP 5.0上线:一句话AI秒出脑图+Todo+PPT+海报,真正的多Agent并行Agent来了!
#5
Harness 成功融资 2.4 亿美元,推动 AI 软件交付发展
#6
千问App校园走红:功能全免费,学生一年省下一个iPad
#7
Medeo AI新版视频Agent震撼登场:自然语言一键改剧本,内容创作从此零门槛!
#8
腾讯发布混元世界模型 1.5,开启实时交互的虚拟世界
#9
Adobe 将 Photoshop、Acrobat 和 Express 直接集成到ChatGPT界面中
#10
蚂蚁集团大动作!“阿福”App来了:新增健康陪伴功能 问答能力升级