BriefGPT.xyz
Ask
alpha
关键词
visual-language pretraining
搜索结果 - 1
ICCV
无术语手语翻译:基于视觉 - 语言预训练的改进
基于视觉 - 语言预训练的无手语互译(GFSLT-VLP)方法通过结合对比式语言 - 图像预训练(CLIP)和掩码自监督学习,构建了一个端到端的模型,实现了在 PHOENIX14T 数据集上的 BLEU-4 分数大幅提升(> +5),取得了
→
PDF
a year ago
Prev
Next