BriefGPT.xyz
大模型
Ask
alpha
关键词
dual-stage training strategy
搜索结果 - 1
DocPedia: 在频域释放大型多模态模型的能力,实现多功能文档理解
DocPedia 是一种新型的大型多模态模型,用于 OCR-free 文档理解,能够处理高分辨率图像。通过在频域而不是像素空间中直接处理视觉输入,DocPedia 能够利用有限数量的视觉标记捕捉更多的视觉和文本信息。通过开发双阶段训练策略和
→
PDF
7 months ago
Prev
Next