EMNLPOct, 2023
通过符号世界知识从自我中心视角定位活动对象
Localizing Active Objects from Egocentric Vision with Symbolic World Knowledge
Te-Lin Wu, Yu Zhou, Nanyun Peng
TL;DR通过学习任务指令的对象信息、利用对象的动作前后条件和描述性知识,我们提出了一种改进短语定位模型的方法,通过大型语言模型来提取动作 - 对象知识,并设计了一种对象短语和符号知识的联合推理技术,实验证明我们的方法在各项指标上都取得了显著的改善。