

论文标题:FLIP : Flow-Centric Generative Planning as General-Purpose Manipulation World Model 项目主页:https://nus-lins-lab.github.io/flipweb/ 论文链接:https://arxiv.org/abs/2412.08261 代码链接:https://github.com/HeegerGao/FLIP

提出了以图像流为中心的通用机器人操控规划方法(FLIP),实现了交互式的世界模型。 设计了图像流生成网络、流条件视频生成网络,以及一种新的视觉语言表示模型训练方法作为 FLIP 的核心模块。 通过实验验证了 FLIP 方法在多种任务上的通用性与优越性,展现了出色的长期规划能力、视频生成质量和策略指导能力。







