BriefGPT.xyz
大模型
Ask
alpha
关键词
scene text analysis
搜索结果 - 1
TextMonkey: 一个无需 OCR 的大型多模态模型用于理解文档
我们介绍了 TextMonkey,一个大型多模态模型(LMM),该模型针对以文本为中心的任务,包括文档问题回答(DocVQA)和场景文本分析。通过采用零初始化的 Shifted Window Attention,我们在更高的输入分辨率下实现
→
PDF
4 months ago
Prev
Next