4438x成人动漫中新社北京4月27日电(记者 陈溯)在2024中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技27日正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。
据介绍,Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。Vidu是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。
该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
朱军表示,Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。
在当天的论坛上,清华大学教授、生数科技首席科学家朱军表示,与Sora一致,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
“值得一提的是,Vidu采用的是‘一步到位’的生成方式。”朱军表示,与Sora一样,文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理。
自今年2月Sora发布推出后,团队基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,在短短两个月进一步突破长视频表示与处理关键技术,研发推出Vidu视频大模型,显著提升视频的连贯性与动态性。
“Vidu的命名不仅谐音‘Vedio’,也蕴含‘We do’的寓意。”朱军表示,模型的突破是一个多维度、跨领域的综合性过程,需要技术与产业应用的深度融合,希望与产业链上下游企业、研究机构加强合作,共同推动视频大模型进展。(完)
961.53MB
查看939.86MB
查看73.4MB
查看139.12MB
查看578.20MB
查看274.54MB
查看490.57MB
查看659.57MB
查看396.71MB
查看182.79MB
查看102.22MB
查看570.69MB
查看192.54MB
查看594.46MB
查看411.44MB
查看647.69MB
查看891.97MB
查看785.43MB
查看686.58MB
查看422.84MB
查看773.95MB
查看288.84MB
查看625.22MB
查看318.29MB
查看378.78MB
查看409.51MB
查看482.70MB
查看274.39MB
查看820.57MB
查看662.50MB
查看532.19MB
查看886.87MB
查看652.64MB
查看368.92MB
查看948.19MB
查看674.43MB
查看682.71MB
查看973.66MB
查看860.93MB
查看856.93MB
查看223.67MB
查看604.47MB
查看944.87MB
查看778.87MB
查看922.24MB
查看932.38MB
查看312.65MB
查看589.52MB
查看164.95MB
查看344.57MB
查看844.86MB
查看398.54MB
查看976.28MB
查看556.41MB
查看470.41MB
查看203.19MB
查看828.62MB
查看329.11MB
查看878.16MB
查看747.83MB
查看969.87MB
查看617.52MB
查看749.26MB
查看758.90MB
查看285.56MB
查看509.30MB
查看950.19MB
查看119.75MB
查看844.85MB
查看130.54MB
查看127.83MB
查看260.80MB
查看928.30MB
查看793.67MB
查看158.22MB
查看118.41MB
查看726.89MB
查看747.48MB
查看904.63MB
查看154.92MB
查看442.87MB
查看696.10MB
查看574.64MB
查看219.93MB
查看373.57MB
查看379.71MB
查看576.65MB
查看198.51MB
查看179.65MB
查看575.18MB
查看872.24MB
查看828.51MB
查看608.60MB
查看678.83MB
查看119.52MB
查看395.50MB
查看905.69MB
查看456.67MB
查看667.80MB
查看824.83MB
查看342.90MB
查看473.90MB
查看486.37MB
查看220.44MB
查看
919 荣成ha
美国本土的地又大又好,为啥古代从来没有出现过文明古国?🤐
2025-06-30 19:09:08 推荐
393 188****4414
《艾尔登法环》DLC 上线之初好评如潮,然而两天过去评分却快速下跌,主要原因是什么呢?🤔
2025-07-02 0-1:45:51 不推荐
566 152****2183
模拟电路中如何抑制噪声?🤢
2025-06-30 0-1:23:06 推荐
20 国际飞镖大赛
喜欢自己的发小,咋办?🤥
2025-06-30 13:56:05 推荐