May, 2024

Astro-NER - 天文学命名实体识别: GPT 是否是良好领域专家标注者?

TL;DR本研究使用一个经过精调的 LLM 模型的预测结果来辅助非领域专家标注天文学文献中的科学实体,以便揭示这样的协作过程是否能够逼近领域专家的专业知识。研究结果显示领域专家与 LLM 辅助标注者之间有中等程度的一致性,并且领域专家与 LLM 模型预测之间有相对公平的一致性。另外,我们还比较了精调和默认设置的 LLM 模型在这个任务上的表现。同时,我们还引入了一个经领域专家验证的专门的天文科学实体标注方案。我们的方法采用了以学术研究贡献为中心的视角,专注于与研究主题相关的科学实体。我们创建的包含 5000 个标注天文学文章标题的数据集已公开提供。