Aug, 2023

利用相似性差异解耦的音频差异字幕生成

TL;DR对类似但略有不同的音频剪辑进行语义差异描述的音频差异字幕(ADC)是一项新的扩展任务,通过比较一对音频剪辑和强调潜在空间中的差异以提取差异的交叉注意力集中型变压器编码器来解决常规音频字幕生成类似标题的问题。