BriefGPT.xyz
Ask
alpha
关键词
bpe
搜索结果 - 3
字节对编码是自动孟加拉语语音识别所需的全部
通过实验证明,对于孟加拉语,Byte pair encoding (BPE) 是一种在自动语音识别(ASR)中改善识别性能的有效分词方法,较佳的 BPE token 数量为大约 500-1000 个。
PDF
5 months ago
ACL
分词对语音翻译性别偏差的影响
本文探讨了中性的分词组件是否会影响到翻译性别,以及某些分词方法是否会惩罚女性语言标记的表示。作者比较了 5 种不同的分词策略,并发现最先进的子单词拆分技术 (BPE) 导致更高的性别偏见。因此,我们提出一种结合字符级分词更好地翻译性别,同时
→
PDF
3 years ago
ACL
基于形态学意识的分词在低资源神经机器翻译中的有效性
比较了基于形态学和 BPE 方法的子词切分对低资源神经机器翻译任务的影响,发现其对翻译性能影响不一,并且各自有表现最好的情况。
PDF
3 years ago
Prev
Next