BriefGPT.xyz
大模型
Ask
alpha
关键词
image-text contrastive learning
搜索结果 - 2
ICML
多模态数据集精炼的低秩相似性挖掘
提出了一种用于多模态数据集精简的低秩相似度挖掘(LoRS)方法,通过同时挖掘图像 - 文本对中的准确相似度矩阵,并利用低秩因式分解实现高效和可伸缩性,在现有算法上取得了显著的改进,对于视觉语言数据集精简领域做出了重要贡献。
PDF
a month ago
图像文本匹配指导的场景文本识别字典
本文提出了一种基于场景图像 - 文本匹配(SITM)网络的新字典语言模型,该模型通过使用图像 - 文本对比(ITC)学习在特征空间中将正面的图像 - 文本对更紧密地匹配,从而避免了显式字典语言模型中的缺点。在六个主流基准测试中,我们的词库方
→
PDF
a year ago
Prev
Next