BriefGPT.xyz
Ask
alpha
关键词
pretrained speech models
搜索结果 - 2
RepAugment:面向输入的表示层数据增强用于呼吸音分类
探索预训练语音模型在呼吸音分类中的有效性,并提出了能够处理预训练语音波形的输入不可知表示级别增广技术。实验结果表明,该方法优于 SpecAugment,在少数疾病类别的准确性上实现了显著改善,最高达到 7.14%。
PDF
2 months ago
T5lephone:基于音素级 T5 模型的语音与文本自监督模型桥接技术来实现口语理解
本文研究使用不同分词策略的预训练语言模型对口语语言理解任务的影响,特别是在语音问答和语音翻译方面。通过使用音素文本进行预训练,创建了一个名为 T5lephone 的变种,并取得了 NMSQA 的最新成果,同时在端到端问答和翻译中超越了其他类
→
PDF
2 years ago
Prev
Next