BriefGPT.xyz
大模型
Ask
alpha
关键词
bleu gain
搜索结果 - 3
ACL
神经机器翻译的确定性可逆数据增强
确定性可逆数据增强(DRDA)是一种简单但有效的数据增强方法,用于神经机器翻译,通过采用确定性分段和可逆操作生成多粒度子词表示,并通过多视角技术将它们拉近,无需额外的语料库或模型变更,DRDA 在几个翻译任务中优于强基线模型(Transfo
→
PDF
23 days ago
使用自监督预训练和数据增强增强的直接语音翻译
本文讨论了直接语音到语音翻译模型面临的数据稀缺性问题,探索了自监督预训练和数据增强技术来解决此问题,实验表明自监督预训练可以提高模型性能,结合数据增强技术可以进一步提高模型性能。
PDF
2 years ago
ACL
真实数据上的无字幕语音翻译
我们提出了一种无需文本数据即可构建的无文本语音到语音翻译系统,采用了自监督单元级别的语音标准化技术来优化多说话者语音的模型,仅使用了 10 分钟的数据训练该技术,可在 VoxPopuli S2ST 数据集上实现平均 3.2 BLEU 分数的
→
PDF
3 years ago
Prev
Next