MMApr, 2021

AMSS-Net: 针对文本查询的用户指定源音频处理

TL;DR本文提出了一种神经网络,可根据给定的描述,对给定音频轨道的用户指定来源(例如人声)进行音频转换,同时保留未在描述中提到的其他来源。我们提出了一个评估基准,用于评估几个 AMSS 任务,证明 AMSS-Net 在几个 AMSS 任务上通过目标度量和经验验证优于基线。