Aug, 2023

双向生成改进音频 - 视觉分割

TL;DR通过建立视觉特征与声音的鲁棒相关性,利用双向生成框架实现音频 - 视觉分割的改进性能,在 AVS 基准测试中取得新的最先进表现水平,并发布源代码与预训练模型。