BriefGPT.xyz
大模型
Ask
alpha
关键词
large visual-language models
搜索结果 - 1
大型视觉 - 语言模型中利用对比学习增强视觉文档理解
利用对比学习框架 DoCo,该研究填补了大型视觉 - 语言模型在处理富文本场景中的细粒度特征缺失问题,提高了对文本丰富的文档的视觉表示,并在多个视觉文档理解基准上取得了优越的性能。
PDF
4 months ago
Prev
Next