EMNLPOct, 2023
大型语言模型和多模态检索在视觉词义消歧中的应用
Large Language Models and Multimodal Retrieval for Visual Word Sense Disambiguation
Anastasia Kritharoula, Maria Lymperaiou, Giorgos Stamou
TL;DR通过多种方法,包括多模态检索、大型语言模型、问题回答以及学习排序模型等,本文深入研究了视觉词义消歧任务,以揭示其有趣的特性,为未来研究方向提供了有价值的启示。