BriefGPT.xyz
Ask
alpha
关键词
cross-modal alignment transformer
搜索结果 - 1
超越融合:一种用于遥感图像 - 文本检索的多尺度对齐方法
遥感图像文本检索领域的研究论文,介绍了一种新的多尺度对齐方法,使用多尺度图像特征和本地化文本特征进行交叉对齐,并引入语义对齐损失与跨尺度多模态语义一致性损失,通过在多个数据集上的评估证明了其优越性。
PDF
a month ago
Prev
Next