Jul, 2022

谁是谁?利用文献数据进行深度作者姓名消歧

TL;DR本论文提出在数字图书馆中解决作者名称歧义(ANA)的问题。我们使用的数据集包含来自 DBLP 仓库的超过 500 万条记录,由大约 260 万位共同作者撰写。我们的方法首先将具有相同姓和同名首字母的作者分组。每组中的作者通过与他 / 她的共同作者和研究领域的关系来确定,我们采用了神经网络模型来学习共同作者和标题的表示。针对大型数据集进行了广泛的实验,并验证了我们方法的有效性。