Jul, 2022
视听概念系统的跨模态对齐学习
Cross-Modal Alignment Learning of Vision-Language Conceptual Systems
Taehyeong Kim, Hyeonseop Song, Byoung-Tak Zhang
TL;DR本文提出了学习与婴儿词汇学习机制相似的视觉 - 语言概念系统的方法,包括了在线学习视觉对象和词汇之间的关联以及自监督学习的语义表示等。作者在目标词与词语匹配以及零样本学习任务中进行了定量和定性检验,结果表明该模型在性能方面优于其他基础模型并实现了概念系统的拓扑对齐。