Jul, 2023

文档智能理解研讨会

TL;DR文件理解和信息提取是自动理解文档并提取有价值信息的不同任务。该研究聚焦于发展领域包括商业、法律和医学在内的文档理解,以提高大量文档相关工作的效率。此外,该研究还推出了一个数据挑战,针对最近发布的文档级视觉问答(PDFVQA)数据集,旨在促进对自然语言全文档多个连续页面的结构和上下文理解的模型研究。该任务有助于将文档理解从单页水平提升到全文档水平。