Sep, 2024

基于端到端ASR模型的实时转录评估

TL;DR本研究解决了实时转录中音频分割带来的挑战,传统的ASR模型未能有效支持实时处理。通过评估三种音频分割算法(固定间隔、语音活动检测和反馈分割),本研究提出了一种新的反馈算法,能在延迟减少的同时仅略微提高错误率。该研究的发现为实时转录系统的设计提供了优化方案,具有重要的实际应用价值。