BriefGPT.xyz
Ask
alpha
关键词
visual entity recognition
搜索结果 - 1
将语言模型与视觉实体识别连接
AutoVER 是一种用于视觉实体识别的自回归模型,通过使用检索增强的约束生成来扩展多模态大型语言模型,以解决在域外实体上表现不佳但在需要视觉定位推理的查询上表现出色的问题。该方法通过在与序列到序列目标并行训练的同时对困难的负样本对进行对比
→
PDF
4 months ago
Prev
Next