Dec, 2021

使用自然语言查询的音频检索:基准研究

TL;DR本研究提出了三个新的跨模态检索基准,用于研究现有文献中关注度较低的文本 — 音频和音频 — 文本检索任务。研究团队通过不同音频任务的预训练,在这三个基准上建立了交叉模态文本 — 音频和音频 — 文本检索的基线,并公开了数据集和代码,希望这些基准能够激发有关自由文本查询的音频检索的研究。