Aug, 2023

描述的任何事物分开

TL;DR通过自然语言查询实现了语言查询音频源分离(LASS),并为开放领域的音频分隔提供了 AudioSep 基础模型,展示了强大的分隔性能和令人印象深刻的零 - shot 推广能力。