Sep, 2024
检索、注释、评估、重复:利用多模态大型语言模型进行大规模产品检索评估
Retrieve, Annotate, Evaluate, Repeat: Leveraging Multimodal LLMs for
Large-Scale Product Retrieval Evaluation
TL;DR本研究解决了大规模产品检索系统评估中人类标注者不足的问题。提出了一种框架,利用多模态大型语言模型生成个性化的注释指南并进行注释,经过验证显示其质量与人工标注相当,显著降低了时间和成本,并快速发现问题,成为生产级质量控制的有效解决方案。