随时间学习词语相关性

EMNLPJul, 2017

Learning Word Relatedness over Time

Guy D. Rosin, Eytan Adar, Kira Radinsky

TL;DR通过抽取一种从纵向数据集中提取出的时间关系模型，该篇论文为查询扩展任务提供了一种算法框架，以实现对搜索系统中的历史内容的更精确的识别和检索。

Abstract

search systems are often focused on providing relevant results for the "now", assuming both corpora and user needs that focus on the present. However, many corpora today reflect significant longitudinal collections ranging from 20 years of the Web to hundreds of years of digitized news

search systems temporal intent historical content temporal relationship model query expansion

发现论文，激发创造

一种结构化学习方法用于时间关系提取

本文讨论识别事件之间时间关系的问题，提出了一种结构化学习方法，以解决在学习识别这些关系时必须考虑依赖关系的挑战。同时，该方法还提出了一个新的处理缺失关系问题的角度，并在两个基准数据集上取得了显著的改进。

Jun, 2019

历史与多元文化：协助历史学家搜索新闻档案

通过新闻档案库，利用时序因素对历史研究进行分析，为满足历史学家的信息需求设计了 “Historical Query Intent” 搜索任务，提出了 HistDiv 算法来协助历史研究中的查询行为，并通过研究结果表明，该算法可以优化子主题检索能力。

Oct, 2018

学习在对话式搜索中与先前交谈内容的关联

本文提出了一种新的方法来选择与当前查询相关且有用的历史查询，采用伪标记法进行注释，结合多任务学习框架并在微调过程中进行选取模型和检索模型联合训练，提高对话式搜索中检索效果。

Jun, 2023

科学文献间关系解释

本文介绍了通过自然语言文本解释两个科技文档之间关系的任务，提出了一个新的数据集和模型，探索使用科学信息提取系统的密集表示对提高解释性能的影响，并在自动和人类评估中证明了该模型的可行性和挑战。

Feb, 2020

用于改善基于分类体系的搜索引擎意图估计的语义语料库自动生成

本文介绍了语义扩展检索系统中影响最大的语义关联作用，并提出在准确性和噪音引入之间寻找最佳平衡的方案，最后通过构建自然语言处理系统并利用系统的多种知识资源进行评估。

Mar, 2022

神经排序模型中的词汇和时间信号整合，用于搜索社交媒体流

本文中探索了一种利用递归神经网络来挖掘社交媒体中时间信号的替代方法，将已有的神经排序模型与双向 LSTM 层集成，以抓取相邻文档在时间上的时序连贯性，并且实验证明通过整合语义和时间信号可以显著提高排序的效果。

Jul, 2017

构建未来：评估文本分类器的时间持久性

本文针对文本分类模型随时间推移性能下降的问题，从实用角度出发，评估了不同语言模型和分类算法的长期稳定性以及数据集特征对时间性稳定性的影响，并在三个跨度为 6 至 19 年的数据集上进行了实际分类实验。

May, 2022

学习句子内部的时间关系

本文提出了一种基于数据密集的方法来推断句内时间关系，旨在实现 NLP 应用中的时间信息的提取和综合，比如摘要和问答，通过利用像 after 这样的标记来避免手动编码的需求，我们的方法首先表明，训练模型可以在用时暂未看到的情况下选择正确的标记，然后评估所提出的方法是否有望半自动创建时间注释，比较了许多概率模型在不同方面的差异。

Oct, 2011

TIMELINE：新闻文章中支持自动排序事件的时间关系的详尽注释

该研究论文介绍了一种新的标注方案，以解决现有时间关系注释新闻数据集中存在的问题，并自动化了标注过程，从而减少了时间和人力成本。该论文还报告了基于新语料库进行训练和评估基线时间关系提取模型的结果，并与广泛使用的 MATRES 语料库的结果进行了比较。

Oct, 2023

时间概念漂移和对齐：比较知识组织系统在时间上的实证方法

该研究探讨了知识组织系统（KOS）中的时间概念漂变和时间对齐。采用 1910 年美国国会图书馆主题词表，2020 年 FAST Topical 和自动索引进行比较分析。使用 90 个 19 世纪《大英百科全书》条目作为案例研究，通过全文索引和命名实体识别等方法建立索引；分析了结果并证实了历史词汇可以用于生成代表 KOS 和历史资源中的时间概念漂移的过时主题词。此研究方法提供了一种改善历史人文资源的背景和知识组织系统变化研究的方法。

Aug, 2022