AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——
传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局,

得益于这一分工,
除了文本操控,
为了解决多视觉片段串联时模型容易认混的难题,团队还引入了 SA-3D RoPE 位置编码机制,赋予不同视觉片段专属标记,从而在保留时空位置关系的同时分清参考素材与输出目标。目前,在字节自建的测试中,该框架已稳居行业第一梯队。据悉,

AI 视频生成与编辑领域迎来底层逻辑的重构。字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——
传统的视频编辑往往面临主体变形、背景漂移或动作断裂等技术瓶颈。为了打破这一僵局,

得益于这一分工,
除了文本操控,
为了解决多视觉片段串联时模型容易认混的难题,团队还引入了 SA-3D RoPE 位置编码机制,赋予不同视觉片段专属标记,从而在保留时空位置关系的同时分清参考素材与输出目标。目前,在字节自建的测试中,该框架已稳居行业第一梯队。据悉,
美国第二大教师工会美国教师联合会近日发起行动,呼吁禁止AI系统进入小学课堂,并要求低龄学生远离iPad等设备,以确保人类教师主导早期教育。联合会主席兰迪·温加滕提出十项核心要求,其中关键条款是立即禁止AI介入小学生日常教学。
蚂蚁数科在2026上海SNEC光伏展上发布两款能源行业智能体产品——「电力交易智能体」和「新能源运营智能体」,均基于自研平台DTClaw开发,可批量构建具备行业专家能力的AI员工。目前已与林洋智维、协鑫新能源合作落地,首次将智能体应用于能源领域,旨在解决新能源电站依赖人工决策、高频交易市场反应慢的问题。
OpenAI在《AI上岗》发布会上推出Codex工作流插件,面向股票投资、创意设计等岗位,让AI深度融入企业日常流程,替代知识工作者任务。Codex从编程工具扩展至非编程领域,引发资本市场关注。
谷歌DeepMind发布开源大模型Gemma4,虽参数规模保持约300亿,但“单位参数智能密度”显著提升,性能媲美一年半前的顶尖闭源模型。其核心突破在于引入“E2B”(参数卸载)架构,标志着开源大模型底层架构的重大升级。
孙正义凭借人工智能热潮,以约1000亿美元身家重登亚洲首富,软银集团市值超越丰田,成为日本最高上市公司。福布斯数据显示,软银股价6月1日大涨14%,市值一度突破48万亿日元,截至6月3日达约48.79万亿日元。