Nov, 2023

DONUT 空洞:通过发掘知识并优化学习效率的 DONUT 稀疏化

TL;DRDONUT-hole 是一种稀疏 OCR-free 视觉文档理解(VDU)模型,通过优化策略实现了模型密度的 54% 减少,同时保持性能,并在文档图像关键信息提取(KIE)任务中展示其对物流公司开发更高效 VDU 系统的潜力。