你的位置:世博体育官网2024安卓最新版_手机app官方版免费安装下载 > 新闻 > 欧洲杯体育  中新社记者 陈溯 摄据先容-世博体育官网2024安卓最新版_手机app官方版免费安装下载

新闻
欧洲杯体育  中新社记者 陈溯 摄据先容-世博体育官网2024安卓最新版_手机app官方版免费安装下载
发布日期:2024-06-09 13:20    点击次数:85

中新社北京4月27日电(记者 陈溯)在2024中关村论坛年会将来东谈主工智能前锋论坛上欧洲杯体育,清华大学长入生数科技27日厚爱发布中国首个永劫长、高一致性、高动态性视频大模子——Vidu。

该模子领受团队原创的Diffusion与Transformer和会的架构U-ViT,支撑一键生成长达16秒、分辩率高达1080P的高清视频本色。

4月27日,在2024中关村论坛年会将来东谈主工智能前锋论坛上,清华大学长入生数科技厚爱发布Vidu。  中新社记者 陈溯 摄

据先容,Vidu不仅梗概模拟真正物理寰球,还领有丰富思象力,具备多镜头生成、时空一致性高档特质。Vidu是自Sora发布之后大家最初获取要紧冲破的视频大模子,性能全面临标海外顶尖水平,并在加快迭代普及中。

在本日的论坛上,清华大学教师、生数科技首席科学家朱军示意,与Sora一致,Vidu梗概凭据提供的文本描写径直生成长达16秒的高质地视频。除了在时长方面的冲破外,Vidu在视频效果方面扫尾显赫普及,主要体当今模拟真正物理寰球、多镜头说话、时空一致性高、集中中国元素等方面。

4月27日,在2024中关村论坛年会将来东谈主工智能前锋论坛上,清华大学长入生数科技厚爱发布Vidu。Vidu在视频效果方面扫尾显赫普及,梗概生成专有的中国元素,举例熊猫、龙。 中新社记者 陈溯 摄

“值得一提的是,Vidu领受的是‘一步到位’的生成步地。”朱军示意,与Sora同样,文本到视频的鼎新是径直且连气儿的,在底层算法扫尾上是基于单一模子弥漫端到端生成,不触及中间的插帧和其他多智力的措置。

朱军示意,Vidu的快速冲破源自于团队在贝叶斯机器学习和多模态大模子的弥远积聚和多项原创性效果。其中枢期间U-ViT架构由团队于2022年9月淡薄,早于Sora领受的DiT架构,是大家首个Diffusion与Transformer和会的架构,弥漫由团队自主研发。

自本年2月Sora发布推出后,团队基于对U-ViT架构的长远集中以及弥远积聚的工程与数据教养,在短短两个月进一步冲破长视频示意与措置要津期间,研发推出Vidu视频大模子,显赫普及视频的连贯性与动态性。

“Vidu的定名不仅谐音‘Vedio’,也蕴含‘We do’的寓意。”朱军示意,模子的冲破是一个多维度、跨鸿沟的空洞性流程,需要期间与产业利用的深度和会欧洲杯体育,但愿与产业链障碍游企业、研究机构加强合营,共同鼓舞视频大模子弘扬。(完)



Powered by 世博体育官网2024安卓最新版_手机app官方版免费安装下载 @2013-2022 RSS地图 HTML地图