Apr, 2025
ManipDreamer:通过动作树和视觉引导提升机器人操控世界模型
ManipDreamer: Boosting Robotic Manipulation World Model with Action Tree
and Visual Guidance
TL;DR本研究解决了现有机器人操控视频合成中指令跟随和视觉质量提升的不足,通过引入动作树结构和视觉引导,改进了指令原语之间的关系学习。研究表明,ManipDreamer在视频质量和指令跟随能力上显著提升,评估显示其在未见任务中的PSNR和SSIM均有所提高,且成功率也有提升。