May, 2024

SLIDE: 一个融合小型和大型语言模型的开放领域对话评估框架

TL;DR使用Small and Large Integrated for Dialogue Evaluation(SLIDE)框架,结合小型专门模型(SLM)和大型语言模型(LLMs)来解决开放领域对话系统中的一对多问题和领域特定场景下的性能不佳问题。该方法通过对比学习、语义敏感度度量和结合SLM和LLMs的评估结果等技术,实现了分类和评估任务的最新性能,并且SLIDE评估器与人工判断更好地相关。