BriefGPT.xyz
大模型
Ask
alpha
关键词
visually grounded speech processing
搜索结果 - 1
同步还是顺序训练?多任务自监督学习系统中语音表示如何协作
本文研究了基于 wav2vec 2.0 的自我监督学习和基于 transformer 的视觉接地语音的联合优化作为多任务学习系统,发现先进行 wav2vec 2.0 的串行训练,再进行 VGS 可以提高音频 - 视觉检索的性能,但是并行 S
→
PDF
a year ago
Prev
Next