ACLJun, 2024
大型语言模型下的交互式文本图像检索:一种即插即用方法
Interactive Text-to-Image Retrieval with Large Language Models: A Plug-and-Play Approach
Saehyung Lee, Sangwon Yu, Junsung Park, Jihun Yi, Sungroh Yoon
TL;DR该论文主要关注互动式文本图像检索任务中对话形式的上下文查询问题。PlugIR 方法利用 LLMs 的一般指令遵循能力以两种方式解决了这个问题。该方法不仅提出了一种新颖的评估指标 BRI,还展示了在各种基准测试中优于零射击和微调基准线的优越性能。