Jan, 2025

利用半监督学习和大语言模型优化爱沙尼亚电视字幕

TL;DR本研究解决了爱沙尼亚电视内容字幕质量不足的问题。通过对人生成的爱沙尼亚字幕进行Whisper模型微调,并结合迭代伪标签和大语言模型后期编辑,研究显示该方法显著提升了字幕质量,尤其在测试时应用LLM编辑提高了字幕准确性。此方法有望创造接近人类标准的字幕质量,并可扩展至实时应用。