Jul, 2023

科学文献中的定理和证明的多模态机器学习

TL;DR使用多模态分类方法从数学文章中提取定理环境和证明,包括文本、字体信息和位图渲染等多个模态,并采用序列信息进行特征融合和模型训练。实验证明多模态方法比单一模态更有效,并且采用基于条件随机场的块序列建模可以显著提高性能。