Sep, 2024
注意间隙:基于瞥见的主动感知改善视觉推理的泛化能力和样本效率
Mind the GAP: Glimpse-based Active Perception improves generalization
and sample efficiency of visual reasoning
TL;DR本研究解决了AI系统在理解视觉关系时面临的挑战,特别是对于未见过对象的处理。通过引入一种新颖的基于瞥见的主动感知系统,该方法利用瞥见动作生成的位置信息和周围视觉内容,成功提取超出直接视觉内容的视觉关系,最终在多项视觉推理任务上实现了先进的性能,展示了更好的样本效率和泛化能力。