随时间学习词语相关性
本文讨论识别事件之间时间关系的问题,提出了一种结构化学习方法,以解决在学习识别这些关系时必须考虑依赖关系的挑战。同时,该方法还提出了一个新的处理缺失关系问题的角度,并在两个基准数据集上取得了显著的改进。
Jun, 2019
通过新闻档案库,利用时序因素对历史研究进行分析,为满足历史学家的信息需求设计了 “Historical Query Intent” 搜索任务,提出了 HistDiv 算法来协助历史研究中的查询行为,并通过研究结果表明,该算法可以优化子主题检索能力。
Oct, 2018
本文提出了一种新的方法来选择与当前查询相关且有用的历史查询,采用伪标记法进行注释,结合多任务学习框架并在微调过程中进行选取模型和检索模型联合训练,提高对话式搜索中检索效果。
Jun, 2023
本文介绍了通过自然语言文本解释两个科技文档之间关系的任务,提出了一个新的数据集和模型,探索使用科学信息提取系统的密集表示对提高解释性能的影响,并在自动和人类评估中证明了该模型的可行性和挑战。
Feb, 2020
本文介绍了语义扩展检索系统中影响最大的语义关联作用,并提出在准确性和噪音引入之间寻找最佳平衡的方案,最后通过构建自然语言处理系统并利用系统的多种知识资源进行评估。
Mar, 2022
本文中探索了一种利用递归神经网络来挖掘社交媒体中时间信号的替代方法,将已有的神经排序模型与双向 LSTM 层集成,以抓取相邻文档在时间上的时序连贯性,并且实验证明通过整合语义和时间信号可以显著提高排序的效果。
Jul, 2017
本文针对文本分类模型随时间推移性能下降的问题,从实用角度出发,评估了不同语言模型和分类算法的长期稳定性以及数据集特征对时间性稳定性的影响,并在三个跨度为 6 至 19 年的数据集上进行了实际分类实验。
May, 2022
本文提出了一种基于数据密集的方法来推断句内时间关系,旨在实现 NLP 应用中的时间信息的提取和综合,比如摘要和问答,通过利用像 after 这样的标记来避免手动编码的需求,我们的方法首先表明,训练模型可以在用时暂未看到的情况下选择正确的标记,然后评估所提出的方法是否有望半自动创建时间注释,比较了许多概率模型在不同方面的差异。
Oct, 2011
该研究论文介绍了一种新的标注方案,以解决现有时间关系注释新闻数据集中存在的问题,并自动化了标注过程,从而减少了时间和人力成本。该论文还报告了基于新语料库进行训练和评估基线时间关系提取模型的结果,并与广泛使用的 MATRES 语料库的结果进行了比较。
Oct, 2023
该研究探讨了知识组织系统(KOS)中的时间概念漂变和时间对齐。采用 1910 年美国国会图书馆主题词表,2020 年 FAST Topical 和自动索引进行比较分析。使用 90 个 19 世纪《大英百科全书》条目作为案例研究,通过全文索引和命名实体识别等方法建立索引;分析了结果并证实了历史词汇可以用于生成代表 KOS 和历史资源中的时间概念漂移的过时主题词。此研究方法提供了一种改善历史人文资源的背景和知识组织系统变化研究的方法。
Aug, 2022