据国内多家媒体报道,清华大学联合生数科技正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。
该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容,画面效果跟Sora极为接近。
专家表示,在当今数字化时代,人工智能技术以其日益突出的角色和潜力,引领着科技创新的浪潮。
这次Vidu的到来,标志着AI技术迈入了一个全新阶段,它不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点,这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
Vidu未来能支持生成更加多样化、更长时长的视频内容,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。