Jun, 2024

推动手写文件上的问答:基于最先进识别的模型的 HW-SQuAD

TL;DR该研究提出了一种基于识别的新颖方法,通过使用基于变压器的文档检索和集成方法在模型层面上改进了 HW-SQuAD 和 BenthamQA 数据集上的现有最先进技术,分别实现了 82.02%和 92.55%的精确匹配得分,在 HW-SQuAD 和 BenthamQA 数据集上超过了现有最佳的基于识别的方法 10.89%和 26%。我们还增强了文档检索组件,将前五次检索的准确性从 90%提高到 95.30%。我们的研究结果证明了我们提出的方法在推进手写文档问答方面的重要性。代码和训练模型将公开提供,以促进未来在这一关键领域的研究。