BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modal relations
搜索结果 - 2
LANISTR:来自结构化和非结构化数据的多模态学习
LANISTR 是一种基于注意力机制的框架,能够学习语言、图像和结构化数据,并通过一种基于相似度的多模态掩蔽损失函数来学习大规模多模态数据中跨模态的关系。在两个具有挑战性的公开数据集 MIMIC-IV 和 Amazon 产品评论上,与现有的
→
PDF
a year ago
EMNLP
多模态 Transformer 上的自适应对比学习用于评论有用性预测
本研究旨在提高现代评论有用性预测系统的性能,提出了一种基于多模态对比学习的方法,聚焦于输入模态之间的信息,提高了跨模态关系的显式表达,并引入自适应加权策略以提高优化的灵活性,同时提供了多模态交互模块以解决多模态数据的分布不一致问题,实验证明
→
PDF
2 years ago
Prev
Next