在 AI 技术迅猛发展的背景下,Lightricks 公司近日发布了其最新研发的 AI 视频生成模型 ——LTX-2。这一模型能够一次性生成长达20秒的完整4K 叙事高清视频,配有声音和口型同步,为视频创作带来了革命性的进展。

LTX-2的核心技术在于其音画同步生成能力,传统的 AI 视频生成工具往往只能生成无声视频,随后需要人工添加配音。而 LTX-2则在同一个扩散过程中同时生成画面与声音,确保角色的嘴型与语音、爆炸的音效与光线、走路的节奏与脚步声完全同步。这一创新使得生成的视频更具真实性和连贯性。

此外,LTX-2支持最高4K 分辨率和50帧每秒的输出,画面质量堪比电影级别。其连贯性和稳定性在视频生成领域中也达到了新的高度,成为首个能够稳定生成原生4K 视频的开源 AI 模型。这意味着,创作者们可以直接将生成的视频用于电影、广告或宣传片,而不再是简单的 AI 动画草图。

该模型还支持多种输入方式,包括文字、图片和草图,允许创作者对视频的镜头角度、物体动作、时间节奏等进行精细控制。这种创作自由度的提高使得内容创作者可以更好地表达自己的创意。此外,内置的 LoRA(Low-Rank Adaptation)微调机制让用户能够以少量素材训练出专属风格模型,确保视频在不同场景中的一致性。

LTX-2的另一个显著优势是其本地运行能力,用户无需连接云端,也不被锁定在收费平台上。该模型可在消费级 GPU 上运行,预计将在2025年秋季开放源代码、模型权重及训练流程,为创作者、开发者和研究者提供更多的控制权和隐私保障。

Lightricks 公司计划于今年晚些时候将 LTX-2的代码和性能基准开源,进一步推动 AI 视频生成技术的发展。用户可以通过官方平台体验这一新模型,期待在未来的 AI 创作领域,LTX-2能够成为视频制作的 “游戏规则改变者”。

随着 LTX-2的发布,视频创作的门槛将进一步降低,更多的创作者有机会借助这一先进技术实现自己的创意与梦想。