Jul, 2024

音视通用零样本学习简洁方法

TL;DR简介:该研究提出了一个名为EZ-AVGZL的简单而有效的Easy Audio-Visual Generalized Zero-shot Learning框架,通过将音频-视觉嵌入与转换的文本表示对齐,学习了音频-视觉和文本的模态之间的关系,实现了音频-视觉广义零样本学习中的最先进表现。