BriefGPT.xyz
大模型
Ask
alpha
关键词
remote sensing image captioning
搜索结果 - 2
遥感图像字幕生成中的交互式图像 - 文本对齐引导
基于视觉语言预训练的新型交互式傅里叶变换方法,用于实现远程感知图像字幕生成,通过对遥感图像和文本特征的更好对齐,提高了语义一致性,并在多个数据集上表现出超过其他方法的优越性能。
PDF
7 months ago
RSGPT:遥感视觉语言模型与基准
大规模语言模型的出现显著推动了人工智能的快速发展,并引发了人工智能 2.0 的革命。远程感知领域对于开发专门针对数据分析的大规模视觉语言模型越来越感兴趣。然而,目前的研究主要集中在视觉识别任务上,缺乏对齐并适用于训练大规模视觉语言模型的全面
→
PDF
a year ago
Prev
Next