AI预判了你的预判!人大高瓴团队发布TTR,教会AI一眼看穿你的下一步
- 2025-03-20 10:22:00
- 刘大牛 转自文章
- 244

论文标题:Think-Then-React: Towards Unconstrained Human Action-to-Reaction Generation 论文链接:https://openreview.net/pdf?id=UxzKcIZedp 项目链接:Think-Then-React.github.io





去除思考(w/o Think):FID 从 1.942 上升到 3.828,证明了思考阶段对反应生成的重要性。 去除预训练(w/o All PT.):模型性能大幅下降,表明预训练对于适应运动 - 语言模态至关重要。 去除不同预训练任务:三种预训练任务(动作 - 动作、空间 - 位姿、动作 - 文本)均有正向贡献,互为补充。 去除单人数据(w/o SP Data):仅依赖多人的数据仍可取得较好结果,单人数据的补充对模型表现提升不显著。


单人动作数据有效性
为了进一步分析单人数据贡献较小的原因,作者在同一空间中可视化了单人运动(HumanML3D)、交互动作(Inter-X Action)和交互反应(Inter-X Reaction)的运动序列,如上图所示。
重新思考时间间隔
动作描述质量
作者还在运动描述任务上对 TTR 模型进行了评估,结果下表所示。基线方法的结果来源于 Inter-X 论文的附录 A.1。由于基线方法均使用动作和反应作为输入,而 TTR 的思考过程仅能访问真实的动作,因此作者首先调整 TTR 的设置,使其与基线方法一致,记作 TTR∗。

思考 / 动作描述
为了探究思考过程的必要性,作者比较了不同的提示对反应生成的影响。

发表评论
文章分类
联系我们
联系人: | 透明七彩巨人 |
---|---|
Email: | weok168@gmail.com |