BriefGPT.xyz
Feb, 2023
社会科学中词嵌入的评估
Evaluation of Word Embeddings for the Social Sciences
HTML
PDF
Ricardo Schiffers, Dagmar Kern, Daniel Hienert
TL;DR
本文介绍了基于37,604篇开放获取的社会科学研究论文构建和评估词向量模型。在评估中,我们比较了特定领域和通用语言模型在语言覆盖、多样性和语义关系方面的差异。我们发现,即使词汇表的大小相对较小,所创建的特定领域模型覆盖了社会科学概念的大部分,与更通用的模型相比,邻域更加多样化。在所有关系类型中,我们发现更广泛的语义关系覆盖范围。
Abstract
word embeddings
are an essential instrument in many
nlp
tasks. Most available resources are trained on general language from Web corpora or Wikipedia dumps. However,
→