Oct, 2023

描述标签与术语描述的匹配

TL;DR语义文本相似性在软件工程中具有重要作用,在工程师需要澄清描述性标签(例如,业务术语、表列名)的语义的任务中,这些标签通常由过于简短或过于通用的词组成,并在其信息技术系统中出现。我们将这种问题定义为将描述性标签与词汇表描述匹配的任务。然后,我们提出了一个框架,利用现有的语义文本相似性测量(STS),并使用语义标签增强和基于集合的上下文化来增强它,其中前者是一种检索与给定标签相关的句子的方法,而后者是一种计算两个上下文之间相似度的方法,其中每个上下文均来自一组文本(例如,同一表中的列名)。我们对两个由公开可用数据源生成的数据集进行了实验,结果表明,所提出的方法能够帮助底层 STS 正确匹配更多的描述性标签与描述。