发布日期:2024-05-01 04:43 点击次数:151
快科技4月28日音问,在2024中关村论坛年会过去东说念主工智能时尚论坛上,生数科技聚首清华大学发布中国首个永劫长、高一致性、高动态性视频大模子Vidu。
这亦然自Sora发布之后大众最初获得紧要冲破的视频大模子,性能全濒临标国外顶尖水平,还在加快迭代升迁中。
据了解,该模子收受团队原创的Diffusion与Transformer和会的架构U-ViT,复旧一键生成长达16秒、区分率高达1080P的高清视频本色。
除了在时长方面冲破,Vidu在视频适度方面也兑现了显赫升迁,主要包括:
大致生成细节复杂的场景,股票投资且合适真正的物理限定;
大致生成真正天下不存在的假造画面,创造出具有深度和复杂性的超实际办法本色;
大致生成复杂的动态镜头,不再局限于简便的推、拉、移等固定镜头,而是大致围绕长入主体在一段画面里就兑现出息、近景、中景、特写等不同镜头的切换;
在16秒的时长上保合手连判辨顺,跟着镜头的出动,东说念主物和场景在时期、空间中大致保合手一致;
大致生成私有的中国元素,举例熊猫、龙等。