Jun, 2024

通过优化音频编码增强基于大型语言模型的自动音频字幕生成

TL;DR增强自动音频字幕生成的方法通过预训练音频编码器、查询变换器和大语言模型,改善了音频标记的准确性和结果性能。