VBench-2.0:面向视频生成新世代的评测框架
- 2025-03-28 18:14:00
- 刘大牛 转自文章
- 249



论文标题:VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness 论文链接:https://arxiv.org/abs/2503.21755 视频:https://www.youtube.com/watch?v=kJrzKy9tgAc 代码:https://github.com/Vchitect/VBench 网页:https://github.com/Vchitect/VBench-2.0-project
Human Fidelity(人体动作与结构)
Controllability(可控性)
Creativity(创造性)
Physics(物理规律)
Commonsense(常识推理)
分层与解耦的 18 个评测维度
开源 Prompt List 体系
与人类观感对齐的自动评测
多视角观察助力下一代视频生成



VBench-1.0:适用于评估视频生成的「表面真实性」,如视觉质量、文本匹配与整体流畅度等。在现阶段为各家模型的进步提供了强力支持。
VBench-2.0:在保留 VBench-1.0 优势的同时,进一步聚焦视频的「内在真实性」。当我们想真正判断一个模型有没有「世界模型」,能否用在更深层次的创作和应用场景时,VBench-2.0 的评测就尤为关键。




比较天马行空的创意性的生成: Sora 想要生成人相关的运动镜头: HunyuanVideo 或者 Kling 1.6 想要实现精确的相机控制: Kling 1.6 想要生成严格遵从文本指示的视频: CogVideoX-1.5 想要模拟基础的物理定律: CogVideoX-1.5
用提示词或者 In-context 学习的范式来提示 video caption 模型 人工添加部分该类型文本数据
发表评论
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |