告别分镜制作!生数科技Vidu Q1"参考生"重塑视频制作流程

在WAIC2025世界人工智能大会上，生数科技重磅发布Vidu Q1"参考生视频"功能，通过算法创新彻底颠覆传统视频制作流程，为视频生成领域带来突破性进展。

告别分镜，一键直出视频

"参考生视频"最大亮点在于跳过复杂的前期分镜制作环节。用户只需上传人物、道具、场景等参考图，配合文字提示，即可直接生成完整视频素材。制作流程从传统的"分镜生成——视频生成——剪辑——成片"简化为"参考图——视频生成——剪辑——成片"。

例如，输入"诸葛亮与丘吉尔、拿破仑在会议室讨论"的提示词，上传三位历史人物参考图和会议室场景图，系统即可生成三人同框对话的完整视频。

拟人化兔子吹笛子动漫电影

破解商业化核心难题

该功能核心优势在于解决视频模型商业化的关键瓶颈——主体一致性问题。Vidu Q1参考生目前支持最多七个主体同时输入并保持一致，据生数科技表示，这已能满足绝大部分创作场景需求。

生数科技CEO骆怡航表示，这种通用创作方式将更好地服务广告、动漫、影视、文旅、教育等多元商业场景，实现从线下拍摄到线上AI创作的本质转变。

技术路径与产业导向

生数科技采用U-ViT架构，结合扩散模型与Transformer技术，并在此基础上优化算法模块。Vidu模型内置多模态理解能力，已成功应用于视频生成。

骆怡航强调，团队以产业落地为主要导向，暂未将理解与生成一体化作为优先级，"行业客户更关心内容效果而非技术路线"。

拓展具身智能新领域

7月25日，清华大学与生数科技联合发布具身智能模型Vidar，通过"视频大模型+具身智能"路径实现低成本、少样本泛化。

骆怡航解释，视频模型与具身智能在本质上都处理时空信息，采用相同的输入决策逻辑。团队基于Vidu视频大模型，通过少量机器人实操视频训练，可将虚拟视频转化为对应机械臂动作，有效解决传统VLA路线的数据稀缺问题。

目前，Vidu仍以提升视频生成能力为最高优先级，将具身智能作为持续探索方向，为该领域开启潜在商业市场。

腾讯全面展示AI时代产品应用图，发力3D世界模型与具身智能平台Tairos

腾讯在2025世界人工智能大会发布"1+3+N"AI全景体系，以混元大模型为核心，推出混元3D世界模型、具身智能平台Tairos等创新技术。该体系包含三大平台：B/C端智能体开发平台、机器人领域的具身智能平台，以及覆盖多行业的AI应用矩阵，全面展示腾讯AI战略升级。通过核心模型驱动与多元应用结合，为AI产业化提供完整解决方案。

稚晖君携灵犀X2亮相WAIC主论坛，发布业界首个具身智能操作系统开源计划

智元机器人在2025世界人工智能大会上发布具身智能操作系统"智元灵渠OS"开源计划，其人形机器人灵犀X2通过自然对话展现智能交互能力。该系统采用分层开源模式，包含底层中间件、智能体框架和工具链，计划第四季度启动。智元机器人已在工业物流等领域实现应用落地，其"启元通用具身大模型"获SAIL之星奖。未来将持续完善操作系统，推动具身智能产业发展。

WAIC重磅发布:萝卜快跑等获上海自动驾驶示范运营资质

上海在2025世界人工智能大会上发放新一批智能网联汽车示范运营牌照，萝卜快跑等企业首批获准，推动自动驾驶商业化进程。获牌企业可在浦东新区金桥、花木、世博等重要功能片区开展自动驾驶服务，覆盖商务、居住、会展等核心场景。萝卜快跑不仅入选中国人工智能产业创新成果展，还为大会提供L4级自动驾驶接驳服务，展现技术实力和产业影响力。

国务院国资委发布AI“焕新社区”:聚集244个模型、158个数据集

2025世界人工智能大会期间，国务院国资委发布人工智能"焕新社区"开源平台，由25家央企、民企、高校等机构联合发起。平台聚焦算力、模型、数据等六大功能，已汇集244个行业模型和158个高质量数据集，并打造国产化、具身智能等特色专区，推动国产AI生态建设。

“AI教父”辛顿中国首秀：WAIC警示人工智能双刃剑，呼吁探索“善良AI”

"AI教父"辛顿首访中国引热议。在2025世界人工智能大会上，这位77岁的图灵奖和诺奖得主警告AI可能超越人类智能，呼吁警惕"养虎为患"。他特别强调，在追求AI技术进步的同时，必须研究如何让AI保持"善良"，虽然目前尚无相关技术，但这是关键研究方向。辛顿的观点在业内引发广泛讨论。