BriefGPT.xyz
Ask
alpha
关键词
logos
搜索结果 - 2
SLANT: 虚假标志分析工具
在线内容中存在许多标志,这些标志广泛应用于用于预训练视觉语言模型的大量网络抓取的数据集中。通过开发了一个工具集 SLANT,我们发现一些标志确实会导致虚假的错误预测。SLANT 的标志可被视为对基础模型的有效攻击,为了应对这一威胁,我们还提
→
PDF
a month ago
本地化、分组和选择:通过场景文本建模提升文本 - VQA
本文提出了一种名为 Localize, Group, and Select (LOGOS) 的模型,它利用场景文本聚类和光学字符识别(OCR)技术来更好地定位图像的关键信息、实现跨模态理解,并从不同来源的 OCR 文本中选择最佳答案,成功解
→
PDF
3 years ago
Prev
Next