Mar, 2025
Vi-LAD:社交意识机器人在动态环境中的视觉语言注意力蒸馏导航
Vi-LAD: Vision-Language Attention Distillation for Socially-Aware Robot
Navigation in Dynamic Environments
TL;DR本研究解决了机器人在动态环境中导航时缺乏社交意识的问题。通过引入新的视觉语言注意力蒸馏方法,Vi-LAD 通过转换模型的中间层表示来提炼社交导航知识,生成增强的注意力图,从而提升机器人任务的成功率。实验结果表明,Vi-LAD 在导航成功率上相较于传统方法提高了 14.2% - 50%。