关键词text similarity metrics
搜索结果 - 3
- EMNLPRankAug: 文本分类的增强数据排名
本研究提出了一种名为 RankAug 的文本排名方法,通过多样性的词汇和句法,检测和过滤出最具相似意义的顶级增强文本,从而改善生成数据过滤在自然语言理解任务中的性能,特别是意图和情感分类。通过对多个数据集进行实验,我们证明了过滤技术的精心选 - GNAT: 通用叙事对齐工具
通过将生物信息学中的 Smith-Waterman 算法与现代文本相似度度量相结合,我们开发了一种用于故事对齐的通用方法,并展示了对于摘要和节选,相较于原始小说更短的具有大的版本之间的相似性是很难识别的。我们的方法在四个不同的问题领域上应用 - FaNS:基于分面的叙事相似度度量
为了准确识别语义相似的叙述,本文提出了一种新的基于经典的 5W1H 要素(谁、什么、何时、何地、为什么和如何)的叙述相似度度量方法,通过利用先进的大型语言模型(LLMs)来提取这些要素,并通过组合六个不同要素的匹配结果来优化匹配效果,通过实