May, 2024

我们能利用大型语言模型填补相关性评判空缺吗?

TL;DR利用大型语言模型填补测试集中的空缺,以扩展现有的测试集合,并找出人工注释与自动注释的一致性差异,从而更好地满足人类需求的工作。