May, 2023

从学术文章中提炼文本分类和物体识别的框架

TL;DR本论文提出了一种机器学习与基于规则的混合方法,称为 TBRF,用于数据挖掘学术论文中的特定信息,通过分析学术论文中的标准布局和排版方法,通过实验验证表明,该方法可以在分类准确率和表格及图片检测准确率方面达到超过 95% 和 90% 的精度。