BriefGPT.xyz
Ask
alpha
关键词
cross-modal information processing
搜索结果 - 1
使用图形注意力学习图像文本匹配的双重语义关系
本文提出了一种名为双重语义关系注意力网络 (DSRAN) 的新型图注意力方法,该方法主要由两个模块组成,分别进行不同层次的语义关系学习,从而提高图像文本匹配的准确性,并在 MS-COCO 和 Flickr30K 数据集上取得了显著优于以往方
→
PDF
4 years ago
Prev
Next