本研究提出一种基于概念共现的框架,集成于研究助手系统,用于加速学术灵感的产生与发现。实验结果表明,该系统具有广阔的前景和应用价值。
Jun, 2023
该论文提出了一个连接的系统,包括三个同构神经语义匹配模型,用于联合进行文献检索、句子选择和索证,以进行事实提取和验证。实验结果表明,该神经语义匹配方法在所有证据检索指标上都显著超越了常见的 TF-IDF 和编码器模型,并通过提供内部语义关联得分和词汇网特征等方法,改进了 NLI 模型的性能,从而在 FEVER 测试集上取得了最优结果。
Nov, 2018
本研究提出了一种基于深度学习的自动化主题注解细化方法,通过在文章摘要中的概念出现来进行弱监督,发现概念出现是自动化主题注解细化的强有力依据,还可以与基于字典的启发式算法相结合以进一步提高准确率。
Jan, 2023
本文介绍了一种基于向量表示和自组织映射的医学文献聚类技术,能够提供更好的文献搜索和浏览体验,并在实验中验证了该技术的有效性。
Oct, 2018
在这项研究中,使用临床自然语言处理技术解决了识别和映射标准术语的问题。提出了一种用于提取临床文本中关键概念的 TF-IDF 快捷方法,并使用基于 transformer 的模型设计了两种下游任务,结果表明 SciBERT 模型在结合提出的方法时具有优越性,并为临床笔记的关键短语提取提供了洞察。
Mar, 2023
该论文介绍了一种基于多模型非线性融合的新模型,通过使用基于词性、TF-IDF 和 word2vec-CNN 算法的 Jaccard 系数来分别衡量句子的相似度,输入加权向量到全连接神经网络,从而降低特征提取的细粒度,全局把握句子特征。实验结果表明,句子相似度计算方法的匹配率为 84%,模型的 F1 值为 75%。
Feb, 2022
本文提出了一种基于无监督方法的科学文献概念提取方法,通过挖掘后续论文中引用某篇文章的数量,提高了从计算机科学论文语料库中提取概念的精确度,Precision@1000 为 99%。
Jun, 2020
本文研究了资源受限文本数据传输的语义信息提取问题。在所考虑的模型中,需要在通信资源受限的网络中传输文本数据序列,该网络仅允许有限的数据传输。因此,在发送端,使用自然语言处理技术提取原始文本数据,然后将提取的语义信息捕捉到知识图中。该图引入了一个额外的概率维度,以捕捉每个信息的重要性。这个语义信息提取问题被提出为一个优化框架,其目标是提取最重要的语义信息进行传输。为了找到这个问题的最优解,提出了一种基于 Floyd 算法的解决方案,结合了高效的排序机制。数值结果证明了所提算法在语义不确定性和语义相似性等两个新颖性能度量方面的有效性。
Sep, 2023
使用 feature-rich cognitive hypergraphs 模型基于 word association data 预测单词的具体性,相比 pairwise-based feature aggregations 和 pairwise networks 有更好的表现,并且丰富了和语言心理学向量相关的信息。
Apr, 2023
该论文基于 “概念交互图” 模型,通过一系列编码技术比较包含相同概念顶点的句子,并通过图卷积网络聚合匹配信号来匹配文章。在两个数据集上进行的广泛评估表明,该方法在自然语言匹配方面显著优于众多最先进的方法。
Feb, 2018