通过预测专业网页链接的目标页面中与来源上下文最相关的部分,可以更加有效地帮助读者在链接网页中发现信息。我们引入了作者锚点数据集和读者锚点评估集来分析这个问题,并使用 T5-based 排名方法作为性能基准。
May, 2023
本文针对维基百科上的网页结构,研究了基于锚文本信息的链接预测的困难性和算法,提出了合适的评估抽样方法及基准模型.
May, 2021
我们探讨了链接预测作为自动获取与新文档的主题或背景相关的现有文献的代理方法。我们的模型使用基于变压器的图嵌入来编码每个文档的含义,这些文档作为引文网络中的节点呈现。我们展示了我们的模型生成的语义表示在推荐和排名任务中可以胜过其他基于内容的方法。这为在那些需要这些文档正确互相引用以最小化可能出现的不一致性的领域中探索引文图提供了一种整体的方法。
Mar, 2024
本文提出了一种基于超链接进行预训练的方法,并将其应用于信息检索(IR)任务中,实验结果表明此方法在大规模的 IR 和问答数据集上具有优越性。
Sep, 2022
本文提出了一种基于二阶矩的无锚点主题挖掘框架,采用一次特征值分解和少量线性规划,只需较弱的条件即可确保识别主题,并在实践中表现出更好的鲁棒性。
Nov, 2016
本文介绍了一种协议,它允许用户与锚定词进行交互以构建定制和可解释的主题模型,并提供了实验证据来证明我们方法的实用性。
Jun, 2019
本文首次对 Anchors 方法进行了理论分析,针对文本分类算法,使用 TF-IDF 向量化步骤,将词语替换为固定的词汇表外标记,探究了基于规则的解释性方法在不同模型上的行为,并通过对神经网络的实证研究显示了 Anchors 选择模型输入的局部梯度相对应的词语。
May, 2022
本文研究了一种基于对比学习的无监督检索方法,应用于网络锚点文本,提出了一种去除非信息锚点的筛选技术,并展示了该方法的性能优于目前的先进方法,特别适用于搜索和问答任务。
本文提出了一种基于 Graph Neural Networks 的新型深度学习方法,以解决如何预测大型演化网络中链接出现的问题,特别地,预测与 AI 相关的主题之间的链接。实验结果表明,使用此方法能够有效地识别出节点的吸收和密集子图的合并两种模式,且模型具有较高的预测准确性。
Jan, 2022
提出了一种用于视觉故事叙述任务的学习模型,其主要思想是从图片中预测锚定词嵌入,并联合使用嵌入和图片特征生成叙述句,方法设计简单,易优化,在大多数自动评估指标中取得最佳结果,在人员评估中也优于竞争方法。
Jan, 2020