BriefGPT.xyz
Ask
alpha
关键词
subword tokens
搜索结果 - 4
使用音节子词标记进行开放词汇马拉雅拉姆语语音识别
本文探讨了在马拉雅拉姆语自动语音识别中使用音节子单元作为音素字典和语言模型,并评估了词汇量、内存需求和词语错误率的相对改善。
PDF
a year ago
使用从端到端自动语音识别获取的声学 - 文本子词表示进行音频到意图的转换
提出了一种从音频和文本信息中使用子词标记进行用户意图识别的方法,使用了端对端 ASR 模型提取音频信息与 CBOW 模型分析文本信息构建表示,通过结合位置编码的方式处理多个 ASR 假设同时存在的问题,实现了对于语音助手的用户意图高精准度的
→
PDF
2 years ago
ACL
拼字比赛中的模型:语言模型隐式学习到了单词字符组成
通过分析预训练语言模型的嵌入层,研究表明该模型对于整词和子词令牌的内部字符构成也有很高的学习能力。虽然该模型没有直接使用字符信息,但它仍然能够拼写正确达到整体词汇量的三分之一,并在所有令牌类型上达到了高平均字符模型重叠度。而且,通过额外的字
→
PDF
3 years ago
ACL
不使用嵌入的神经机器翻译
通过实现以字节作为序列的计算机文本的表示,同时将深度学习模型中的嵌入层替换为每个字节的一热表示,可以在不影响模型性能的情况下,将最先进的机器翻译模型推广到字节级别。
PDF
4 years ago
Prev
Next