May, 2023
从学术文章中提炼文本分类和物体识别的框架
A Framework For Refining Text Classification and Object Recognition from Academic Articles
Jinghong Li, Koichi Ota, Wen Gu, Shinobu Hasegawa
TL;DR本论文提出了一种机器学习与基于规则的混合方法,称为 TBRF,用于数据挖掘学术论文中的特定信息,通过分析学术论文中的标准布局和排版方法,通过实验验证表明,该方法可以在分类准确率和表格及图片检测准确率方面达到超过 95% 和 90% 的精度。