关键词human evaluation protocol
搜索结果 - 3
- 一种全面级联系统、基准测试和人类评估协议,用于表达性语音翻译
本文提出了一个将多个韵律转移技术综合起来的综合层次系统(holistic cascade system)来把源语言的情感转移到目标语言中。我们还建立了一个基准的情感测试集来评估多重情感维度。实验结果表明,这种综合建模方法优于单一方面的研究。
- ACL图像字幕的透明人工评估
本文介绍了一种基于机器和人生成的 MSCOCO 数据集上的图像标注模型的评估协议 THumB,用于评估图像文本的质量。我们的实验发现,使用图像特征的近期度量值 CLIPScore 更符合人类评判标准。
- AAAI抽象化摘要的联合解析与生成
本文提出了一种新颖的神经网络架构用于抽象概括及句法解析的同时生成摘要,同时还描述了一种新颖的人工评估协议来评估摘要是否符合原始含义,经评估证明该方法在多个摘要数据集上与强基线相比表现出有竞争力的结果。