Mar, 2024

使用经过微调的 XLSR Wav2Vec2 在自定义数据集和 mBART 上对视频进行转录和翻译

TL;DR通过最小的数据量,利用检索式语音转换和自监督表示的方法,对个性化语音识别模型进行训练,实现多语言视频内容转录和翻译的无障碍解决方案。