BriefGPT.xyz
Ask
alpha
关键词
stop words
搜索结果 - 4
通过 L2 范数打折解决高频词余弦相似度低估问题
本文提出了一种通过将上下文词嵌入以及单词在语料库中的频率相结合,通过降低高频词的 L2 范数,在求取词间余弦相似度时有效解决现有计算方法低估的问题,实验结果表明了所提出方法的有效性。
PDF
a year ago
处理软件工程文档所需的停用词:它们很重要吗?
探讨在软件工程背景下,使用领域特定的停用词表是否可以提高自然语言处理中停用词去除方法的性能表现,并在相关工作的基础上复制实验了三个软件工程研究工具。结果表明,使用领域特定的停用词可以显著提高研究工具的性能,并且 17 个评估指标都显示出更好
→
PDF
a year ago
乌兹别克语停用词检测精度:以 “学校语料库” 为例的案例研究
本文介绍了一种用于评估停用词列表质量的方法,以自动创建技术。该方法在乌兹别克语的自动生成停用词列表上进行了测试,可以应用于相似语言。
PDF
2 years ago
使用停用词和变音符号进行罗曼语言的自动语言识别
本研究提出了一种基于停用词和变音符词典的统计方法,用于自动识别文本语言,主要关注罗曼语系。实验证明该方法的准确率在小文本上超过 90%,而在大文本上超过 99.8%。
PDF
6 years ago
Prev
Next