Mar, 2020
STEM-ECR数据集:将STEM学科学术内容中的科学实体引用奠基于权威百科和词典源
The STEM-ECR Dataset: Grounding Scientific Entity References in STEM
Scholarly Content to Authoritative Encyclopedic and Lexicographic Sources
TL;DR本论文介绍了STEM-ECR v1.0数据集,旨在提供一个科学实体抽取、分类和解析的基准,该数据集由10个STEM学科的摘要组成,展示其跨学科的概念形式化以及自动抽取和人工标注的性能表现,同时提出了三种实体解析过程及其人工标注的方法。