本文针对维基百科上的网页结构,研究了基于锚文本信息的链接预测的困难性和算法,提出了合适的评估抽样方法及基准模型.
May, 2021
本研究使用服务器日志构建模型自动发现有用的超链接并提出了一种有效算法以在预算约束下实现链接放置,该方法可以应用于任何网站,并在维基百科和生物医学研究网站 Simtk 上进行了验证。
Dec, 2015
本文提出了一种基于超链接进行预训练的方法,并将其应用于信息检索(IR)任务中,实验结果表明此方法在大规模的 IR 和问答数据集上具有优越性。
Sep, 2022
本文提出利用语义 Web 技术对超链接进行清理,构建 Web 结构图,并探索了噪音链接对信息检索和链接挖掘算法的影响。研究表明,语义 Web 技术可以准确地清除噪音链接。
Mar, 2023
通过预测专业网页链接的目标页面中与来源上下文最相关的部分,可以更加有效地帮助读者在链接网页中发现信息。我们引入了作者锚点数据集和读者锚点评估集来分析这个问题,并使用 T5-based 排名方法作为性能基准。
May, 2023
本文介绍了一种以自然语言推理为基础的链接预测方法,将链接预测任务应用于维基百科文章,并在 Data Science and Advanced Analytics 2023 竞赛中取得了优异成绩。
Aug, 2023
文中提出了一个在维基百科上添加用户定义标签的界面,并通过一个应用原型来评估它的有效性,以改进文章导航和检索的方法。
Feb, 2012
论文提出了在缺乏背景知识和长尾实体的情况下,通过自动化生成实体出现位置的候选项并结合用户反馈来提高实体链接的准确性的方法。选择了基于梯度互缠的多样化和文本相关性方法作为生成候选项的方法,并在 FACC 数据集上进行了广泛的实验,展示了该方法的有效性。
Oct, 2018
本研究提供了一种简单而有效的方法,利用维基百科文章中与查询类似的句子,并直接使用其中人工注释的实体作为查询的候选实体,然后使用一系列特征来排名,包括概率、上下文匹配、词嵌入以及候选实体及其相关实体之间的相关性。通过该方法我们可以在实体链接基准测试中取得更好的结果。
Apr, 2017
本研究定义了事件关联,这是一种新的自然语言理解任务,尝试将文章中出现的事件与最相关的维基百科页面链接起来,并贡献了一份数据集用于此任务,同时对两个最新的实体链接模型进行重新训练和评估,并提出了一种用于此任务的竞争性系统 EVELINK。
Dec, 2021