Jul, 2020
NTT DCASE2020 Challenge Task 6 系统:使用关键字和句子长度估计的自动音频字幕
The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning with Keywords and Sentence Length Estimation
Yuma Koizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, Kunio Kashino
TL;DR该报告介绍参加 DCASE 2020 挑战 Task 6 的系统,侧重于使用多任务学习解决自动音频字幕生成中的不确定性问题,并通过在开发测试数据集上测试简化模型,实现了 20.7 的 SPIDEr 得分,远高于基线系统的 5.4。