Jan, 2024

CFMatch: 自动化答案等效评估与专家判断在开放域问答中的对齐

TL;DR通过采用职业人员 QA 竞赛来评估机器 QA 中答案的正确性,结合标准评估和一种更高效、稳健、轻量级的基于偏差 AE 分类器的匹配方法(CFMatch,小于 1 MB),培训和验证以更准确地评估答案的正确性,使得 QA 能够进一步发展。