Apr, 2024

多页文档视觉问答使用自注意力评分机制

TL;DR多页文档视觉问答任务的新方法和有效训练策略,利用视觉特征对文档页进行相关性评分,可在多页场景中提供与最新技术相媲美的性能,且对GPU资源需求较少。