Dec, 2023

图像搜索的当代艺术:通过视觉语言模型进行迭代用户意图扩展

TL;DR利用视觉语言模型的用户意图扩展框架改进了图像搜索引擎,提供更准确和满意的搜索结果。该框架包括两个阶段的过程,即解析阶段和逻辑组合阶段,并允许用户进行灵活的上下文交互以进一步指定或调整搜索意图。研究结果表明,该框架显著提高了用户的图像搜索体验,特别是解析和上下文交互对于用户更准确表达搜索意图和进行愉快的迭代式搜索体验非常有用。