BriefGPT.xyz
Ask
alpha
关键词
audio-visual models
搜索结果 - 1
来自视频的级联多语言视听学习
这篇论文探讨了自监督学习模型在多语言环境下的应用,通过级联方法,将英语训练好的模型应用于日语视频和图片的字幕,取得了最新颖的表现。
PDF
3 years ago
Prev
Next