May, 2023
音频文本跨模态表示的无监督改进
Unsupervised Improvement of Audio-Text Cross-Modal Representations
Zhepei Wang, Cem Subakan, Krishna Subramani, Junkai Wu, Tiago Tavares...
TL;DR本文研究了使用无配对数据进行无监督学习的方法,结合领域特定的有软标签的对比损失方法可以显著提高跨模态音频 - 文本表示学习的效果及其在零样本分类任务中的性能。