本文介绍了一种基于注意力机制的神经网络结构,利用社交网络中的同质性,将分类函数平滑化,从而实现个性化的情感分析模型,提高在 Twitter 和评论数据上的情感分析准确性。
Nov, 2015
该研究提出了一种通过比较不同视角之间的话语语义空间来检测语义变化的方法,发现语义变化不仅发生在时间上,同时也发生在不同视角之间,并且频繁出现的词汇不太可能发生语义改变,而多义词则更可能。
Nov, 2017
本文通过将语义学关系嵌入向量,展示词嵌入的时间动态如何被利用来量化美国20世纪至21世纪对女性和少数民族的刻板印象和态度变化,通过与美国人口普查融合,表明嵌入的变化与时间内的人口和职业转变密切相关,该框架的时间分析为机器学习和数量社会科学之间的新交叉打开了强大的可能性。
本文研究了公开可得的单词嵌入在某些社会层面上的偏见反映了实际调查数据,但并非所有维度的数据都能得到反映,只有最显著的偏见维度,例如性别方面,才能得到准确的反映。
Apr, 2020
本文介绍了一种利用词嵌入发现并分类 Reddit 上语言偏见的数据驱动方法,并通过连接数据中的评价性词语和受保护属性,并经过语义分析系统分类来自动发现 Reddit 社区中编码的语言偏见。
Aug, 2020
通过机器翻译的方式,以词汇为粒度分析分析社交媒体数据集,从而理解不同社区间存在的分化。
Oct, 2020
本文探讨了一种通过比较相关单词上下文来自动识别有偏见语言的方法,即使用在左翼和右翼新闻机构上的词嵌入模型训练,结果表明此方法是有效的。
Dec, 2021
研究机器学习模型,学习低维表示模式,将词嵌入技术应用于人类行为挖掘,探讨其优势和趋势,并警示相似性度量常常在单独层面返回一致结果,但在聚合层面则有可能产生不同结果。
Jul, 2022
本研究使用静态词向量嵌入,构建了上下文化的语义轴,以解决反义词有相邻表示的困境,并在两个人类数据集上验证了这些轴的效果:维基百科职业和过去14年中极端主义男性社区中的多平台讨论,结果显示上下文化的语义轴可以有效区分同一单词类型的不同实例。
Oct, 2022
利用社交媒体数据,我们对美国党派的左右分歧进行语言分析,发现在话题、情感和词汇语义方面存在语言差异,并对可能导致语言分化的沟通问题提出警示。
Sep, 2023