BriefGPT.xyz
大模型
Ask
alpha
关键词
stuttered speech
搜索结果 - 2
优化多重口吃语音分类:利用 Whisper 的编码器实现自动评估中高效参数减少
通过使用先进的语音识别模型 Whisper 以及 6 层编码器的不同层冻结策略,本研究提出了一种计算高效的模型配置来更有效地对多发性口吃语音进行自动分类,取得了显著的性能,同时发现最后一个编码器层在辨别口吃性不流畅语音方面的贡献,使模型适用
→
PDF
23 days ago
集中力的耳语:通过编码器层优化增强口吃语音分类
近年来,在语音处理领域的进展已经引发出具有巨大潜力的尖端深度学习算法,而自动识别口吃症言语是这些研究者采用深度学习技术所致力解决的应用之一。本研究通过旨在聚焦于高效解决方案的重要贡献,解开了 Whisper 在口吃症言语类型分类上的能力,并
→
PDF
8 months ago
Prev
Next