MMApr, 2021
AMSS-Net: 针对文本查询的用户指定源音频处理
AMSS-Net: Audio Manipulation on User-Specified Sources with Textual Queries
Woosung Choi, Minseok Kim, Marco A. Martínez Ramírez, Jaehwa Chung, Soonyoung Jung
TL;DR本文提出了一种神经网络,可根据给定的描述,对给定音频轨道的用户指定来源(例如人声)进行音频转换,同时保留未在描述中提到的其他来源。我们提出了一个评估基准,用于评估几个 AMSS 任务,证明 AMSS-Net 在几个 AMSS 任务上通过目标度量和经验验证优于基线。