Jun, 2023

朝向基于场景的社交推理

TL;DR文章提出了一种使用大型语言模型和视觉语言模型来帮助机器人主动感知环境,执行基于社会情境的推理的方法,并通过发布 MessySurfaces 数据集评估了该框架,发现使用了主动感知的基线平均提高了 12.9%,机器人实验的平均提高了 15%。