BriefGPT.xyz
大模型
Ask
alpha
关键词
document parsing
搜索结果 - 3
Vary:为大型视觉语言模型扩展视觉词汇
通过提出一种名为 Vary 的新方法,可以在现代大型视觉 - 语言模型(LVLMs)中扩展视觉词汇表,从而实现更出色的细粒度感知和理解能力,特别适用于需要密集和细粒度视觉感知的特殊视觉任务,如文档级 OCR 或图表理解,而传统的视觉词汇表在
→
PDF
7 months ago
DocXChain:一个强大的开源工具链,用于文档解析及其之后的工作
DocXChain 是一个强大的开源工具链,用于将非结构化文档(如文本、表格和图表)中的丰富信息自动转换为可读取和可操纵的结构化表示,提供了基本功能如文本检测、文本识别、表结构识别和布局分析,并且可以与现有的工具、库或模型轻松集成,以构建更
→
PDF
8 months ago
DSG:一种端到端的文档结构生成器
在这项研究中,我们介绍了一种名为 DSG 的文档解析系统,它是一种全面可训练的端到端系统,用于将渲染文档映射到结构化的分层格式。我们通过训练 DSG 系统,使其在实际应用中具有高效和灵活的功能,并在评估中证明 DSG 优于商业 OCR 工具
→
PDF
9 months ago
Prev
Next