BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-page documents
搜索结果 - 3
关键词驱动的句子选择增强基于 BERT 的视觉问答
本文描述了 PoliTo 对文档视觉问答竞赛的方法,特别是我们利用文本方法和特定的采样策略,通过细调 BERT 模型,关注包含敏感关键词的句子以回答自然语言问题,如引用表格或图片的问题,以实现高性能的结果。
PDF
9 months ago
AAAI
HRDoc: 文档结构的分层重构的数据集和基准方法
本文提出了一种新的任务:层次化重建多页文档的语义结构,并介绍了基于编码 - 解码结构的层次性文档结构分析系统 (DSPS) 来解决该问题。通过采用多模式双向编码器和结构感知 GRU 解码器,以及软屏蔽操作,DSPS 模型的表现优于基线方法。
→
PDF
a year ago
多层次多模态 Transformer 用于多页文档问答任务
本研究扩展了针对单页文档的 DocVQA 任务到多页文档的场景,提出了一个基于 T5 架构的新的分层方法 Hi-VT5,用于处理长的多页文档,并且通过实验证明本方法可以在单阶段完成回答问题和提供包含答案相关信息的页码,该信息可以作为可解释性
→
PDF
2 years ago
Prev
Next