Mar, 2022

FALCON:通过整合图像、语言描述和概念相关性快速进行视觉概念学习

TL;DR该文提出了一种元学习框架,通过同时观察图片、阅读描述场景中对象的句子和解释补充句子等多个自然出现的数据流来快速学习新的视觉概念,支持问答等应用,其模型命名为 FALCON,使用方框嵌入空间表示视觉概念,包括颜色和形状,并利用关系推理技术推理出未知视觉概念的最优方框嵌入。