AI圈再掀巨浪!阿里巴巴震撼发布并全面开源了其最新力作——通义千问QwQ-32B推理模型。这款被寄予厚望的新模型,并非徒有虚名,而是经过大规模强化学习的千锤百炼,在硬核的数学运算、复杂的代码编写以及通用的AI能力上实现了质的飞跃,整体性能已经能够正面硬刚行业标杆DeepSeek-R1,实力不容小觑。
无需高攀云端!阿里开源全新的推理模型通义千问QwQ-32B,消费级显卡也能跑出S级性能!

AI圈再掀巨浪!阿里巴巴震撼发布并全面开源了其最新力作——通义千问QwQ-32B推理模型。这款被寄予厚望的新模型,并非徒有虚名,而是经过大规模强化学习的千锤百炼,在硬核的数学运算、复杂的代码编写以及通用的AI能力上实现了质的飞跃,整体性能已经能够正面硬刚行业标杆DeepSeek-R1,实力不容小觑。
OpenAI 近期推出了一项新系统,旨在监控其最新的 AI 推理模型 o3和 o4-mini,以阻止与生物和化学威胁相关的提示。该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议,确保 AI 的安全性。OpenAI 表示,o3和 o4-mini 在能力上较之前的模型有显著提升,因此在恶意用户手中可能带来新的风险。根据 OpenAI 的内部基准测试,o3在回答关于某些生物威胁的相关问题时,表现得尤为出色。为了应对这些风险,OpenAI 开发了这个新的监控系统,称之为 “以安全为中心的推理监测器”。这个监测器
Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,展现出极佳的性能。
近日,谷歌在开发者平台 Google AI Studio 及 Gemini 应用程序上发布了其最新的人工智能推理模型 ——Gemini2.5。此模型具备停下来 “思考” 的能力,标志着人工智能技术的新进步。谷歌还推出了 Gemini2.5Pro Experimental,这款多模式推理 AI 模型被认为是迄今为止最智能的。Gemini2.5的发布是谷歌针对每月20美元的 Gemini Advanced 订阅者的一项新服务,用户可以体验到其强大的推理能力。自从2024年9月 OpenAI 发布首个 AI 推理模型以来,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等纷纷推出了各自的推理模
腾讯混元 T1正式版上周发布后,不少用户关心何时能够在元宝中使用这一新版本。对此,腾讯官方在最新消息中宣布,混元 T1正式版与 DeepSeek V3最新版一同上线,为用户带来了全新的体验。混元 T1正式版是腾讯自研的深度思考模型,与之前的 T1Preview 版本相比,进行了全面的升级。新版本不仅提升了速度和性能,还显著改善了综合效果,能够实现秒级响应,满足用户对推理模型的高效需求。用户体验的优化使得混元 T1在各类推理任务中表现得更加出色。此外,与混元 T1同时推出的还有 DeepS
混元T1正式版在大规模强化学习的基础上,针对数学、逻辑推理、科学和代码等理科难题进行了专项优化,从而实现了推理能力的显著提升。在常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得了87.2分的优异成绩
谷歌近日宣布对其推理模型Flash Thinking2.0进行重大升级,同时将深度研究功能的访问权限扩展至所有用户。此次更新带来了多项实用功能,显著提升了人工智能系统的处理能力和用户体验。根据官方介绍,Flash Thinking2.0最新版本新增了文件上传功能,并大幅提高了处理速度。对于Gemini Advanced用户而言,该系统现在能够在单个上下文窗口中处理高达100万个标记的信息量,这意味着AI可以同时分析和理解更大规模的数据集。与此同时,谷歌通过Flash Thinking2.0对深度研究功能进行了优化。升级后的