BriefGPT.xyz
Ask
alpha
关键词
phoneme sequence
搜索结果 - 2
从语音中独立估计发音器官运动和音位对齐
引入了一种新的方法,将声学到口腔运动的转换和音素到口腔运动估计两项任务结合起来,称之为声学音素到口腔运动的反演。探索了两种不同的方法,在推理过程中都采用与说话人和文本无关的方式。使用多任务学习的模式,以端到端的目标将原始语音作为输入,估计相
→
PDF
24 days ago
通过音素序列和 ASR 假设之间的交叉注意力构建强健的口语理解
提出了一种新的基于交叉注意力的 SLU 模型 (CASLU),通过利用语音的音素序列来对抗 ASR 误差,实现同时捕捉输入的语音和语义特征,并在下游 NLU 任务中提高鲁棒性,大量实验证明了其有效性。
PDF
2 years ago
Prev
Next