Jan, 2024

DiarizationLM:大型语言模型的说话人分离后处理

TL;DR介绍了 DiarizationLM 框架,利用大型语言模型对说话人辨别系统的输出进行后处理,可用于提高辨别的可读性或降低词辨别错误率。实验证明,通过使用经过微调的 PaLM 2-S 模型,可以在 Fisher 电话对话数据集上降低 WDER 约 25.9%,在 Callhome English 数据集上降低约 31%。