BriefGPT.xyz
Ask
alpha
关键词
visual-textual alignment
搜索结果 - 2
CVPR
ScaleDet: 一种可扩展的多数据集对象检测器
本文提出了一种可扩展的多数据集检测器 (ScaleDet),使用语义标签相似性通过视觉 - 文字对齐训练来学习标签分配,从而在多个数据集上实现了强大的模型性能,超越了相同骨干网络的最新检测器。
PDF
a year ago
一种双模态方法用于(零样本)多标签分类
该论文提出了一个新算法 - Aligned Dual moDality ClaSsifier (ADDS),其中包括一个双模式解码器 (DM-decoder) 和视觉和文本特征之间的对齐,用于多标签分类任务,并设计了一种称为金字塔前馈 (P
→
PDF
2 years ago
Prev
Next