EMNLPOct, 2021

WMDecompose: 利用词移距离可解释性特征在社会文化分析中的框架

TL;DR提出了一种名为 WMDecompose 的模型和 Python 库,用于将文档级别的距离分解为单词级别的距离,并将单词聚类,以保留有用的词汇信息并进行分析,其在社会科学领域的应用探讨了阴谋论和保守派美国话语之间的相互关系,并提出一种可重复采样文档对的方法,以防止由于不良采样实践而导致的不可靠结果的外推。