Jun, 2024

数学实体:语料库与基准

TL;DR本文旨在提供可用于研究数学语言的不同背景下的带有注释的文献资料,并使用神经解析模型和人工干预预处理这些资料,以提供词性标签、词形还原和依赖树。我们评估了几种自然语言处理模型,在从文献资料中提取的基准数据上测试它们的性能,并展示它们在数学领域中的适应性和对于探索数学语言的有用性。虽然我们提供了学习助手以在特定环境中访问这些资料内容,进一步的工作仍然需要进行以使模型更好地适应数学,并提供更有效的学习助手以及将自然语言处理方法应用于不同的数学领域。