Oct, 2023

分级评估框架:人工评估的最佳实践

TL;DR通过对现有文献进行广泛分析,我们发现在自然语言处理的人工评估方法中存在一些缺陷,这促使我们开发了一种层次化评估框架,该框架具有更全面地表示自然语言处理系统性能的显著优点,并应用于评估机器阅读理解系统及其与人工智能共生模型中的输入和输出的质量之间的关联。