ACLMar, 2022

多语言清单:生成与评估

TL;DR本文介绍了一种使用机器翻译自动提取目标语言的 CheckList 模板的算法,以及将其与不同水平的人工干预下创建的 CheckList 进行比较的度量方法,并探讨对印地语和其他九种语言进行 CheckList 创作的不同方法,最终得出 TEA 加上人工干预的方法最适合将基于 Checklist 的评估扩展到多种语言,并且通过 TEA 可以很好地估算模型的性能。