May, 2025

Miipher-2:一种用于百万小时规模数据恢复的通用语音恢复模型

TL;DR本研究针对训练数据清理中的语音恢复问题,提出了Miipher-2模型,旨在为大型生成模型提供高效的数据清理方法。该模型克服了对未见语言的泛化能力、无显式条件操作以及计算效率等挑战,实验结果显示其在多种语言的词错误率和音质评分上均优于或可比传统模型。