研究论文的基于方面的文档相似度

COLINGOct, 2020

研究论文的基于方面的文档相似度

Aspect-based Document Similarity for Research Papers

Malte Ostendorff, Terry Ruas, Till Blume, Bela Gipp, Georg Rehm

TL;DR本研究介绍了一种基于方面信息的相似度扩展方法，使用 Transformer 模型和 LSTM 基线评估了 172,073 份论文的相似度，结果表明 SciBERT 是最有效的系统，这种基于方面信息的相似度扩展方法可以为文献推荐系统提供更高的粒度和准确度。

Abstract

Traditional document similarity measures provide a coarse-grained distinction between similar and dissimilar documents. Typically, they do not consider in what aspects two documents are similar. This limits the granularity of applications like recommender systems that rely on

发现论文，激发创造

用于基于方面相似性的研究论文的专业文档嵌入

本文讨论了利用基于 aspect 的文本相似性测度进行科学论文推荐的问题，提出了将单一常规嵌入表示文档改为多个具有专业性的嵌入，并在 aspect 特异的嵌入空间中对其进行相似性度量的方案，有效地解决了现有方案中文档连贯性差的问题，并通过与现有方案的比较表明其优越性。

Mar, 2022

使用文本引导的多向量模型用于精细化科学文档相似性

通过匹配文本的精细细节，我们提出了一种新的科学文献相似性模型。我们利用多个论文引用的全文来训练我们的模型，提供了一种新形式的文本监督用于跨论文匹配，具有快速单次匹配和稀疏多次匹配两种方法，提高了在四个数据集上的相似性任务表现。

Nov, 2021

科技评论的基于方面的情感分析

利用基于方面的情感分析从科学评论中提取有用信息可以更好地判断接受 / 拒绝决策，并且发现审稿人之间的不一致程度可能与主席的意见不一致有关。

Jun, 2020

利用文档知识进行方面级情感分类

本文探索了两种从文档级数据转移知识的方法，以提高方面级情感分类的性能。我们在 SemEval 2014、2015 和 2016 年的 4 个公共数据集上证明了我们方法的有效性，并显示注意力机制的 LSTM 从文档级知识中受益。

Jun, 2018

AspectCSE：利用对比学习与结构化知识的基于方面的语义文本相似性句子嵌入

本文提出了 AspectCSE，一种基于对比学习的以方面为基础的句子嵌入方法，并在多个方面的信息检索任务上实现了 3.97％的平均改进。同时，作者还提出使用 Wikidata 知识图谱属性来训练多方面的句子嵌入模型，并证明这种方法优于单方面的嵌入，同时该研究还探讨了基于方面的句子嵌入空间。

Jul, 2023

基于 Transformer 的大语料库语义相似度分析的认知研究

本文利用传统技术和转换器技术对美国专利短语进行语义相似性分析和建模，并对 Decoding Enhanced BERT（DeBERTa）的四种不同变体进行实验，在此基础上通过 K 次交叉验证提高性能，实验结果表明我们的方法比传统技术更具有优越性，平均 Pearson 相关系数为 0.79。

Jul, 2022

科技论文中的自动方面提取

我们的研究旨在创建一个用于从任何领域的俄语科技文本中自动提取方面的工具。本文提供了一份跨领域的俄文科技文本数据集，标注了任务、贡献、方法和结论等方面，并基于经过细调的多语言 BERT 模型提出了一个基准算法用于方面提取。我们展示了不同领域中方面表征存在一些差异，但即使我们的模型仅在有限数量的科技领域进行了训练，它仍能够推广到新的领域，这一点已通过跨领域实验证明。代码和数据集可在 https://github.com/anna-marshalova/automatic-aspect-extraction-from-scientific-texts 上获得。

Oct, 2023

维基百科文章语义关系的两两多类文档分类

本研究旨在解决数字图书馆中文献推荐中相似文档关系的问题，我们将找到两个文档之间关系的问题建模为成对文档分类任务，并采用了一系列技术，如 GloVe，Paragraph-Vectors，BERT 和 XLNet 等不同配置进行实证分析，结果显示使用 BERT 作为最佳表现系统，该发现有助于推动基于此类技术的图书推荐系统的发展。

Mar, 2020

使用方面抽取方法生成评论摘要和用户配置文件

本研究评估了一个新提出的神经模型在提取评论方面的可行性，结果表明该模型能够从用户评论中准确识别和提取各个方面并生成用户偏好的基于方面的概要。

Apr, 2018

基于联合方面 - 情感主题嵌入的弱监督方面为基础的情感分析

本文提出了一种基于弱监督的方法进行情感分析，通过词嵌入空间下的 <情感，方面> 联合主题嵌入来实现预测，通过预训练分类器和自我训练来利用词级别的判别信息。

Oct, 2020