本文使用计算模型通过测试历史性俚语词典词条,探究并表征美国和英国二百年来俚语用法地理变异的规律,并提供了历史文化元素在俚语自然语言处理中的应用的机会。
Oct, 2022
使用 BERT 对 474 个英文 Reddit 社群的两个月评论进行分析,将社群独特的词语类型与不同词义群集的特异性结合起来,识别社群语言偏离常态的情况,并运用社会语言学理论将语言变异与社群行为趋势相联系,发现具有高度独特语言的社群规模适中,其忠诚和高度参与的用户在密集网络中互动。
Feb, 2021
本研究旨在探讨社交网络结构对词汇变化的影响,通过对 4420 个在线社区在 10 年内发生的 80,000 个新词汇的大规模分析,使用泊松回归和生存分析,发现社区的网络结构对词汇变化起着显著作用,特别是密集连接,缺乏本地集群和更多的外部联系对推动词汇创新和保留具有促进作用,同时这些基于主题的社区不会像线下社区一样经历强烈的词汇调整,而是容纳更多的小众词汇。
Apr, 2021
现代计算语言学的研究活动趋势包括语义变化的特征化、新词汇与计算语言学的关系,以及计算语言学算法(如翻译、信息检索、问答等)中语义变化的影响。
Feb, 2024
历史语言学家确定了多种形式的词汇语义变化。我们提出了一个三维框架,用于整合这些形式,并提供了一种统一的计算方法来同时评估它们。这个框架能够经济、系统地绘制词汇语义变化,并在计算社会科学中应用。我们对两个语料库中的心理健康和心理疾病的语义转变进行了分析,展示了关于病态化、社会污名化和概念蔓延的当代关注的语义变化模式。
Jun, 2024
该研究提出了一种通过比较不同视角之间的话语语义空间来检测语义变化的方法,发现语义变化不仅发生在时间上,同时也发生在不同视角之间,并且频繁出现的词汇不太可能发生语义改变,而多义词则更可能。
Nov, 2017
通过构建计算机管道以研究多模态的字符与视觉元素构成的表情包,发现在不同社区之间存在有意义的表情包使用的社会差异,且这些社区内的表情包创新与文化适应模式与书面语言的先前研究结果相吻合。
Nov, 2023
本文介绍了一种利用目标词的词汇上下文嵌入组成的同义分布来预测语义变化的方法,在 SemEval-2020 任务 1 基准数据集上实验证明了该方法优于使用平均嵌入表示的先前方法,并且与当前的最先进技术持平。此外,定性分析表明该方法能够检测到现有方法未能捕获的词语重要语义更改。
May, 2023
该研究介绍了一种新的计算技术,用于检测和分析语言中的地理变异,并使用统计学方法识别特定于地区的显著差异。通过神经语言模型学习单词表示,以捕捉地理区域内的不同语义,该方法是第一种明确考虑偶然变异的方法,同时检测单词含义区域变异。研究使用两个大规模在线数据集进行验证,揭示了多个地理分辨率级别的语言变化的有趣方面。最后,使用该模型,我们提出了一种语言语义相似度的度量标准,并发现在 100 年的时间里,在语义层面上,英式英语和美式英语的差异在缩小。
Oct, 2015
研究在线社区中词汇创新的产生和传播,利用社会语言学理论并关注使用新术语的社交角色之间的关系,揭示创新者和采纳者的特征,并进行预测任务,以预测创新是否能在社区内成功传播。
Jun, 2018