研究论文的基于方面的文档相似度
本文讨论了利用基于 aspect 的文本相似性测度进行科学论文推荐的问题,提出了将单一常规嵌入表示文档改为多个具有专业性的嵌入,并在 aspect 特异的嵌入空间中对其进行相似性度量的方案,有效地解决了现有方案中文档连贯性差的问题,并通过与现有方案的比较表明其优越性。
Mar, 2022
通过匹配文本的精细细节,我们提出了一种新的科学文献相似性模型。我们利用多个论文引用的全文来训练我们的模型,提供了一种新形式的文本监督用于跨论文匹配,具有快速单次匹配和稀疏多次匹配两种方法,提高了在四个数据集上的相似性任务表现。
Nov, 2021
本文探索了两种从文档级数据转移知识的方法,以提高方面级情感分类的性能。我们在 SemEval 2014、2015 和 2016 年的 4 个公共数据集上证明了我们方法的有效性,并显示注意力机制的 LSTM 从文档级知识中受益。
Jun, 2018
本文提出了 AspectCSE,一种基于对比学习的以方面为基础的句子嵌入方法,并在多个方面的信息检索任务上实现了 3.97%的平均改进。同时,作者还提出使用 Wikidata 知识图谱属性来训练多方面的句子嵌入模型,并证明这种方法优于单方面的嵌入,同时该研究还探讨了基于方面的句子嵌入空间。
Jul, 2023
本文利用传统技术和转换器技术对美国专利短语进行语义相似性分析和建模,并对 Decoding Enhanced BERT(DeBERTa)的四种不同变体进行实验,在此基础上通过 K 次交叉验证提高性能,实验结果表明我们的方法比传统技术更具有优越性,平均 Pearson 相关系数为 0.79。
Jul, 2022
我们的研究旨在创建一个用于从任何领域的俄语科技文本中自动提取方面的工具。本文提供了一份跨领域的俄文科技文本数据集,标注了任务、贡献、方法和结论等方面,并基于经过细调的多语言 BERT 模型提出了一个基准算法用于方面提取。我们展示了不同领域中方面表征存在一些差异,但即使我们的模型仅在有限数量的科技领域进行了训练,它仍能够推广到新的领域,这一点已通过跨领域实验证明。代码和数据集可在 https://github.com/anna-marshalova/automatic-aspect-extraction-from-scientific-texts 上获得。
Oct, 2023
本研究旨在解决数字图书馆中文献推荐中相似文档关系的问题,我们将找到两个文档之间关系的问题建模为成对文档分类任务,并采用了一系列技术,如 GloVe,Paragraph-Vectors,BERT 和 XLNet 等不同配置进行实证分析,结果显示使用 BERT 作为最佳表现系统,该发现有助于推动基于此类技术的图书推荐系统的发展。
Mar, 2020
本研究评估了一个新提出的神经模型在提取评论方面的可行性,结果表明该模型能够从用户评论中准确识别和提取各个方面并生成用户偏好的基于方面的概要。
Apr, 2018
本文提出了一种基于弱监督的方法进行情感分析,通过词嵌入空间下的 <情感,方面> 联合主题嵌入来实现预测,通过预训练分类器和自我训练来利用词级别的判别信息。
Oct, 2020