Jun, 2023

低资源环境下基于视觉支撑的少样本词汇学习

TL;DR本研究提出了一种视觉语音模型,能够通过少量的图像和单词样本来学习新词汇及其视觉描述,并通过多模式少量样本的学习在低资源语言 Yoruba 中取得更好的表现。