BriefGPT.xyz
Ask
alpha
关键词
text-image representations
搜索结果 - 2
基于开放世界的文本特定目标计数
提出了 CounTX,一种基于 transformer decoder 的单阶段模型,可对任何类别的目标物体进行计数并能够针对使用文本描述任务的方法在 FSC-147 基准测试上超越现有技术。
PDF
a year ago
对比交叉模态知识共享预训练用于视觉语言表示学习和检索
本研究提出了一种名为 COOKIE 的对比交叉模态知识共享预训练方法,采用传统的双流结构并结合两个有效的模块实现文本 - 图像联合表征,旨在提高跨模态检索的计算效率和统计指标。
PDF
2 years ago
Prev
Next