Nov, 2023

增强跨学科交流的个性化行话识别

TL;DR科学术语识别中,熟悉度指标的使用存在问题。本研究通过收集 11000 多个计算机科学研究人员对术语的熟悉度进行注释分析,发现不同研究人员对术语的熟悉度和信息需求存在巨大差异。研究探讨了个人、子领域和领域知识等特征,以预测个体对术语的熟悉度。结果表明,以个人出版物为基础的提示方法达到了最高的准确率,而零样本提示方法提供了强有力的基准。本研究提供了将个人数据整合到科学术语识别中的特征和方法的洞见。