BriefGPT.xyz
Jan, 2025
利用半监督学习和大语言模型优化爱沙尼亚电视字幕
Optimizing Estonian TV Subtitles with Semi-supervised Learning and LLMs
HTML
PDF
Artem Fedorchenko, Tanel Alumäe
TL;DR
本研究解决了爱沙尼亚电视内容字幕质量不足的问题。通过对人生成的爱沙尼亚字幕进行Whisper模型微调,并结合迭代伪标签和大语言模型后期编辑,研究显示该方法显著提升了字幕质量,尤其在测试时应用LLM编辑提高了字幕准确性。此方法有望创造接近人类标准的字幕质量,并可扩展至实时应用。
Abstract
This paper presents an approach for generating high-quality, same-language
Subtitles
for Estonian TV content. We fine-tune the Whisper model on human-generated Estonian
Subtitles
and enhance it with iterative pse
→