BriefGPT.xyz
Sep, 2023
自动化行为测试在机器翻译中的应用
Automating Behavioral Testing in Machine Translation
HTML
PDF
Javier Ferrando, Matthias Sperber, Hendra Setiawan, Dominic Telaar, Saša Hasan
TL;DR
利用大型语言模型和行为测试的评估框架来检测机器翻译系统的行为,提出了一种通过针对不同场景生成多样的源句子、使用候选集进行验证的方法,并揭示使用准确率等传统度量指标难以察觉的重要差异和潜在错误。
Abstract
behavioral testing
in
nlp
allows fine-grained evaluation of systems by examining their linguistic capabilities through the analysis of input-output behavior. Unfortunately, existing work on
→