Jun, 2024
声道运动编码器:声道运动学作为语音编解码器
Articulatory Encodec: Vocal Tract Kinematics as a Codec for Speech
Cheol Jun Cho, Peter Wu, Tejas S. Prabhune, Dhruv Agarwal, Gopala K. Anumanchipalli
TL;DR基于语音生理学基础,提出了语音的神经编码 - 解码框架 —— 声学编码器,通过训练大规模语音数据实现了完全可理解的、高质量的声学合成器,具有普适性和高性能,为语音的编码系统提供了有力支持。