BriefGPT.xyz
大模型
Ask
alpha
关键词
subtitle data
搜索结果 - 2
EMNLP
六种语言嘈杂字幕中的释义检测
本篇研究提出了采用两种训练模型进行自动同义句检测,发现 GRAN 模型优于 WA 模型,并且对噪声干扰更具鲁棒性,适合于处理更多、更杂的数据,并在其他数据集进行了实验。但是由于域不匹配问题,在测试数据上未能达到相同的性能。
PDF
6 years ago
对话翻译篇章语料库的自动构建
本文提出一种新方法,自动构建对话机器翻译的平行话语语料库,经实验表明,采用该方法可以显著提高翻译质量,同时公开了大约 10 万条已经手动标注了发言者和对话边界的平行话语数据。
PDF
8 years ago
Prev
Next