Jun, 2024

轻量级音频分割用于长篇语音翻译

TL;DR提出了一种小型模型的分段模型,使用 ASR 语音识别与标点任务作为前训练策略并将其整合到 ST 系统中,以提高语音翻译质量。