EASE 是一种基于对句子及其相关实体进行对比学习的句子嵌入方法,其利用实体语义作为丰富的训练信号,并提供了跨语言对齐的监督。在单语和多语境下,EASE 表现出竞争力或更好的性能,并在多项任务中明显优于基线方法。
May, 2022
本研究提出了一个基于监督学习的框架,使用上下文自注意力和多尺度技术对句子进行编码,用于医学问答任务,通过两个评分策略(语义匹配评分和语义关联评分),该框架在医学考试和临床诊断电子病历等集成数据集上实现了显著的改进。
Nov, 2018
通过医疗语料库 MedSTS,本研究旨在组建一种应用于医疗领域的语义文本相似度资源,为今后通过利用自然语言处理技术实现临床决策提供便利。
Aug, 2018
本文提出了一种基于多模态对比目标的句子嵌入学习方法,利用同时包含视觉和文本信息的数据提高了语义相似性任务的性能,并通过分析文本嵌入空间的性质解释了本方法提高性能的原因。
Apr, 2022
本文介绍了一种简单的对比学习框架 SimCSE,通过无监督和监督学习两种方法,显著提高了句子嵌入的性能,适用于语义文本相似性任务。
Apr, 2021
该研究使用分布语义学将结构化知识图谱与非结构化文本相结合,利用概率生成模型预测医学概念之间的新关系,进一步证明该方法可用于医学领域的数据稀缺性问题。
Feb, 2016
本文介绍了一种医学同义词提取新方法,旨在结合术语嵌入与医学领域知识用于医疗应用,其优势在于可扩展性,实验结果表明,该方法较基线方法表现更佳。
Jun, 2015
研究了建立新的 Relational Sentence Embedding(RSE)范式以更好地发现句子嵌入潜力,提出了一种关联嵌入学习方法,作用在源句子上,推断出使用现有的 Siamese-based encoder 的对应目标句子,从学习的嵌入中可以计算出细粒度的关系相似度得分。该方法在 19 个任务中进行了基准测试,取得了良好的效果。
Dec, 2022
通过模板信息,利用自我学习的对比学习框架,构建模板感知的对话句嵌入方法 TaDSE,并通过合成增强数据集增强话语和模板之间的关系,数据实验结果表明 TaDSE 在五项基准数据集上均超越了现有最佳效果,并且意图分类任务的表现较一致。
May, 2023
通过训练较小的编码器模型预测显著实体,使用 SPEER 进行句子级规划以增强摘要的内容涵盖度和准确性。
Jan, 2024