BriefGPT.xyz
Ask
alpha
关键词
document image transformer
搜索结果 - 3
强化学习微调的视觉 - 编码转换器用于 UI 转码生成
本文提出了一种新颖的视觉 - 代码转换器方法,并探索了 Actor-Critic 微调作为提高基线的一种方法,用于从屏幕截图生成高质量代码片段,其性能表现突出,在自动化度量方面表现强大。
PDF
a year ago
DiT:文档图像 Transformer 的自监督预训练
本文提出了 DiT,一种利用大规模未标记文本图像进行自监督预训练的文档图像变压器模型,成为视觉文档 AI 任务的骨干网络,在文档图像分类、文档布局分析、表格检测以及 OCR 的文本检测等诸多任务中取得了最新的最佳结果。
PDF
2 years ago
DocTr: 文档图像转换器,用于几何畸变和照明校正
本文提出了一种新的框架,称为文档图像变压器 (DocTr),以解决文档图像的几何和光照失真问题。 具体来说,DocTr 由几何展开变压器和光照校正变压器组成。 通过设置一组学习的查询嵌入,几何展开变压器通过自注意机制捕获文档图像的全局上下文
→
PDF
3 years ago
Prev
Next