Nov, 2023

集中力的耳语:通过编码器层优化增强口吃语音分类

TL;DR近年来,在语音处理领域的进展已经引发出具有巨大潜力的尖端深度学习算法,而自动识别口吃症言语是这些研究者采用深度学习技术所致力解决的应用之一。本研究通过旨在聚焦于高效解决方案的重要贡献,解开了 Whisper 在口吃症言语类型分类上的能力,并对较深层编码器的重要性进行了探究。