BriefGPT.xyz
Aug, 2023
利用相似性差异解耦的音频差异字幕生成
Audio Difference Captioning Utilizing Similarity-Discrepancy Disentanglement
HTML
PDF
Daiki Takeuchi, Yasunori Ohishi, Daisuke Niizumi, Noboru Harada, Kunio Kashino
TL;DR
对类似但略有不同的音频剪辑进行语义差异描述的音频差异字幕(ADC)是一项新的扩展任务,通过比较一对音频剪辑和强调潜在空间中的差异以提取差异的交叉注意力集中型变压器编码器来解决常规音频字幕生成类似标题的问题。
Abstract
We proposed
audio difference captioning
(
adc
) as a new extension task of audio captioning for describing the
semantic differences
between
→