锚点预测：一种基于主题建模的方法

May, 2022

锚点预测：一种基于主题建模的方法

Anchor Prediction: A Topic Modeling Approach

Jean Dupuy, Adrien Guille, Julien Jacques

TL;DR本文提出了一种上下文相关的关系主题模型 (CRTM)，可用于自动识别源文档中的锚点，无需依赖先前提到的字典或任何外部知识图谱，并可以自动建议链接，展示了该方法在英语、意大利语和德语的维基百科语料库上的实用性。

Abstract

Networks of documents connected by hyperlinks, such as wikipedia, are ubiquitous. hyperlinks are inserted by the authors to enrich the tex

hyperlinks anchor prediction contextualized relational topic model wikipedia link prediction

发现论文，激发创造

Anchor Prediction: 互联网链接的自动优化

通过预测专业网页链接的目标页面中与来源上下文最相关的部分，可以更加有效地帮助读者在链接网页中发现信息。我们引入了作者锚点数据集和读者锚点评估集来分析这个问题，并使用 T5-based 排名方法作为性能基准。

May, 2023

利用锚文本信息预测维基百科链接

本文针对维基百科上的网页结构，研究了基于锚文本信息的链接预测的困难性和算法，提出了合适的评估抽样方法及基准模型.

May, 2021

通过链接预测的定向标准引用推荐与排名

我们探讨了链接预测作为自动获取与新文档的主题或背景相关的现有文献的代理方法。我们的模型使用基于变压器的图嵌入来编码每个文档的含义，这些文档作为引文网络中的节点呈现。我们展示了我们的模型生成的语义表示在推荐和排名任务中可以胜过其他基于内容的方法。这为在那些需要这些文档正确互相引用以最小化可能出现的不一致性的领域中探索引文图提供了一种整体的方法。

Mar, 2024

信息检索的预训练：超链接是否完全被开发？

本文提出了一种基于超链接进行预训练的方法，并将其应用于信息检索（IR）任务中，实验结果表明此方法在大规模的 IR 和问答数据集上具有优越性。

Sep, 2022

无 Anchor 相关主题建模：可辨识性和算法

本文提出了一种基于二阶矩的无锚点主题挖掘框架，采用一次特征值分解和少量线性规划，只需较弱的条件即可确保识别主题，并在实践中表现出更好的鲁棒性。

Nov, 2016

锚定词互动主题建模

本文介绍了一种协议，它允许用户与锚定词进行交互以构建定制和可解释的主题模型，并提供了实验证据来证明我们方法的实用性。

Jun, 2019

文本数据锚点的深度分析

本文首次对 Anchors 方法进行了理论分析，针对文本分类算法，使用 TF-IDF 向量化步骤，将词语替换为固定的词汇表外标记，探究了基于规则的解释性方法在不同模型上的行为，并通过对神经网络的实证研究显示了 Anchors 选择模型输入的局部梯度相对应的词语。

May, 2022

基于 Web 锚点的无监督密集检索训练

本文研究了一种基于对比学习的无监督检索方法，应用于网络锚点文本，提出了一种去除非信息锚点的筛选技术，并展示了该方法的性能优于目前的先进方法，特别适用于搜索和问答任务。

May, 2023

预测人工智能论文中的语义关系的方法

本文提出了一种基于 Graph Neural Networks 的新型深度学习方法，以解决如何预测大型演化网络中链接出现的问题，特别地，预测与 AI 相关的主题之间的链接。实验结果表明，使用此方法能够有效地识别出节点的吸收和密集子图的合并两种模式，且模型具有较高的预测准确性。

Jan, 2022

通过预测故事中的锚定词嵌入进行视觉叙事

提出了一种用于视觉故事叙述任务的学习模型，其主要思想是从图片中预测锚定词嵌入，并联合使用嵌入和图片特征生成叙述句，方法设计简单，易优化，在大多数自动评估指标中取得最佳结果，在人员评估中也优于竞争方法。

Jan, 2020