May, 2023

基于空间变换网络的舌头超声无声语音界面适应性

TL;DR利用深度学习算法从口腔运动数据中合成出可理解的语音,但相关模型区分度较高,对不同用户快速切换不便。该论文中利用空间变换网络(STN)模块扩展深度网络提高使用噪声下的语音接口模型的适应性,该方法有效降低了标准误差并提高了同一发言者不同录音周期的性能。