Jul, 2020

NTT DCASE2020 Challenge Task 6 系统:使用关键字和句子长度估计的自动音频字幕

TL;DR该报告介绍参加 DCASE 2020 挑战 Task 6 的系统,侧重于使用多任务学习解决自动音频字幕生成中的不确定性问题,并通过在开发测试数据集上测试简化模型,实现了 20.7 的 SPIDEr 得分,远高于基线系统的 5.4。