昆仑万维今日正式宣布,他们打造的 Skywork R1V 多模态推理模型,正式开源了!这不仅是中国首个工业界开源的多模态推理模型,更标志着中国AI力量在多模态理解和推理领域,迈出了里程碑式的一步!即日起,模型权重和技术报告完全对外敞开怀抱!




昆仑万维今日正式宣布,他们打造的 Skywork R1V 多模态推理模型,正式开源了!这不仅是中国首个工业界开源的多模态推理模型,更标志着中国AI力量在多模态理解和推理领域,迈出了里程碑式的一步!即日起,模型权重和技术报告完全对外敞开怀抱!



4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场景中表现出色,堪称当前最均衡兼顾视觉与文本推理能力的开源多模态模型。
阶跃星辰科技团队宣布正式推出全新的多模态推理模型 Step-R1-V-Mini。这一模型的发布标志着在多模态协同推理领域的新突破,为AI技术的进一步发展注入了新的活力。Step-R1-V-Mini支持图文输入和文字输出,具备良好的指令遵循能力和通用性,能够高精度感知图像并完成复杂的推理任务。
昆仑万维正式发布了全球首个工业界多模态推理模型 Skywork R1V(简称 “R1V”)。这款具有38亿参数的模型在性能上已接近知名闭源模型 DeepSeek-R1,甚至在多个基准测试中表现出色,横扫了一系列当前的最先进技术(SOTA)。昆仑万维选择开源 R1V,旨在推动技术的共享与进步,为全球 AI 开源社区注入新活力。R1V 以其卓越的多模态推理能力而闻名,能够无缝结合文本和视觉信息,展示出强大的智能。具体来看,R1V 在视觉问答任务中直接对标 Claude3.5Sonnet 和 GPT-4o 等闭源模型,并保持顶级文本推理
Qwen团队近日宣布开源其最新研发的多模态推理模型QVQ,标志着人工智能在视觉理解和复杂问题解决能力方面迈出了重要一步。该模型基于Qwen2-VL-72B构建,旨在通过结合语言和视觉信息,提升AI的推理能力。在MMMU评测中,QVQ取得了70.3的高分,并在多项数学相关基准测试中相较Qwen2-VL-72B-Instruct显示出显著的性能提升。
近日,400多位好莱坞知名创意人士,包括著名导演罗恩・霍华德(Ron Howard)、奥斯卡获奖演员凯特・布兰切特(Cate Blanchett)、音乐传奇保罗・麦卡特尼(Paul McCartney)等,联合向白宫递交了一封信,明确反对开放 AI 和谷歌希望在版权材料上进行 AI 训练的请求。他们认为,美国在人工智能领域的全球领导地位不应以削弱创意产业为代价。图源备注:图片由AI生成,图片授权服务商Midjourney这封信指出,艺术和娱乐行业不仅提供了超过230万的就业机会,每年创造2290亿美元的工资,而且也是美国民主