May, 2024

关于 GPT-4 在文档理解中的适用性注解

TL;DR我们对所有公开可用的 GPT-4 系列模型在文档理解领域进行了遗漏和可重复评估,发现通过提供外部 OCR 引擎识别的文本和文档图像作为输入,GPT-4 Vision Turbo 模型在处理文本语义以外的文本空间排列和视觉线索方面表现良好。评估后的分析结果显示了文本 GPT-4 模型的可能污染以及对长文档的性能显著下降。