利用语义文本相似性进行临床调查数据特征选择

Aug, 2023

利用语义文本相似性进行临床调查数据特征选择

Utilizing Semantic Textual Similarity for Clinical Survey Data Feature Selection

Benjamin C. Warner, Ziqi Xu, Simon Haroutounian, Thomas Kannampallil, Chenyang Lu

TL;DR文献调查数据、机器学习模型、特征选择、特征的文本名称、语义文本相似性评分

Abstract

survey data can contain a high number of features while having a comparatively low quantity of examples. machine learning models that attempt to predict outcomes from →

survey data machine learning models feature selection textual names of features semantic textual similarity scores

发现论文，激发创造

MedSTS：一份用于临床语义文本相似度的资源

通过医疗语料库 MedSTS，本研究旨在组建一种应用于医疗领域的语义文本相似度资源，为今后通过利用自然语言处理技术实现临床决策提供便利。

Aug, 2018

利用语义文本相似度关联症状清单

通过使用语义相似度的人工智能方法，将症状和得分联系起来，从而解决了不同研究环境和研究结果不可比较的问题，提高了症状评估的准确性和临床决策过程中的效率。

Sep, 2023

基于语言条件的语义文本相似度

通过重新注释 C-STS 验证集，并经过全面的数据集分析，我们改进了 C-STS 任务，利用模型理解 QA 任务设置中的条件，从而生成答案，并提出了一种自动错误识别流水线，能够以 80% 以上的 F1 得分识别 C-STS 数据中的注释错误。此外，我们还提出了一种新方法，通过将答案与模型进行训练，大大提高了 C-STS 数据上的性能。最后，我们讨论了基于实体类型的条件性注释方法，并展示了实例中，基于类型 - 特征结构 (TFS) 的方法能够为构建具有新条件的 C-STS 数据提供语言基础。

Jun, 2024

SemEval-2017 任务 1：语义文本相似度 - 多语言和跨语言聚焦评估

研究了句子的语义文本相似度，旨在评估现有模型的性能和限制，并提出一个新的 STS 基准用于对语义表示的研究。

Jul, 2017

可解释的语义文本相似度：发现并解释句子之间的差异

本文研究了在语义文本相似度（STS）的基础上添加可解释性层，通过分析句对之间的对齐关系，给出了一种可度量关系的方法。同时，作者提供了一个公共的数据集来评估系统性能，研究表明该方法可用于进行自然语言的解释并提高用户的接受度。

Dec, 2016

语义相似度预测优于其他语义相似度度量

使用经过微调的模型准确预测语义相似度，以测量自然语言文本之间的语义相似度，与传统的基于子序列重叠或嵌入的方法相比，效果更好。

Sep, 2023

SemScore：基于语义文本相似度的指导调整 LLMs 的自动评估

提出一种称为 SemScore 的直接将模型输出与目标响应进行语义文本相似度比较的简单但非常有效的评估度量，对于评估调整教学语言模型在人工评估方面具有优势。

Jan, 2024

从对话学习语义文本相似度

本论文通过学习使用对话数据学习句子级语义相似性的新方法，利用无监督模型预测对话输入响应对以训练，导出的句子嵌入在语义文本相似性基准测试和 SemEval 2017 的 CQA 问题相似性子任务上表现良好。通过介绍同时进行对话输入响应预测任务和自然语言推理任务的多任务训练来进一步改善性能。广泛的实验显示，所提出的模型在 STS 基准测试中达到了所有神经模型中最佳性能，并且在两个任务中的工程特征和混合系统方面与最先进的混合系统竞争。

Apr, 2018

CSTS: 条件语义文本相似度

通过提出一种新的条件语义文本相似度任务 (conditional STS，C-STS)，旨在找到一个针对性的自然语言条件方面来测量句子之间的相似度，可以减少 STS 的主观性和模糊性并利用多样的条件实现细粒度的相似度评估，并使用各种最先进的模型证明了 C-STS 的挑战性。

May, 2023

描述标签与术语描述的匹配

语义文本相似性在软件工程中具有重要作用，在工程师需要澄清描述性标签（例如，业务术语、表列名）的语义的任务中，这些标签通常由过于简短或过于通用的词组成，并在其信息技术系统中出现。我们将这种问题定义为将描述性标签与词汇表描述匹配的任务。然后，我们提出了一个框架，利用现有的语义文本相似性测量（STS），并使用语义标签增强和基于集合的上下文化来增强它，其中前者是一种检索与给定标签相关的句子的方法，而后者是一种计算两个上下文之间相似度的方法，其中每个上下文均来自一组文本（例如，同一表中的列名）。我们对两个由公开可用数据源生成的数据集进行了实验，结果表明，所提出的方法能够帮助底层 STS 正确匹配更多的描述性标签与描述。

Oct, 2023