- 基于 LLM 的多智能体模拟的语言演化来规避社交媒体监管
社交媒体平台在全球交流中起着至关重要的作用,但在地缘政治敏感地区经常受到严格监管。本研究提出了一种基于大型语言模型的多代理模拟框架,用于探索在受监管的社交媒体环境中用户语言的演变。研究发现,大型语言模型能够模拟受限环境中的细致语言动态和交互 - ACL时间机器 GPT
大型语言模型(LLMs)通常在广泛的、时间不加区分的文本语料库上进行训练,反映了缺乏带有时间元数据的数据集。本文提出了一种新的方法:一系列时间点的 LLMs,称为 Time Machine GPT(TiMaGPT),专门设计为非预测性的。这 - 语言模型中的紧迫沟通与学习压力:语言演化透视
通过对自发交流模型的文献综述,我们确定了塑造语言模型的关键压力:交流成功、效率、易学性和其他心理 / 社会语言因素,并认为这可以为语言习得和语言演化研究的语言模型设计提供启示。
- 从采用到适应:追踪新表情符号在 Twitter 上的传播
通过对采样的英语推特的大数据集进行分析,我们研究了新发布的表情符号在社交媒体中如何获得关注并发展其意义,发现早期采纳者的社群规模和表情符号的语义对其受欢迎程度至关重要,某些表情符号在传播过程中经历了意义和情感关联的显著转变,此外,我们提出一 - 声音在系统发育重构中是否有效?
通过对十个不同语系的多样数据集和最先进的自动同源词和音序对照检测方法的建立,我们首次测试了基于音序对比与基于同源词对比的方法在语系重建中的性能,并发现从同源词重建的语系与黄金标准语系之间的拓扑距离平均上缩短了约三分之一。
- 借助联邦学习从用户校正中改进语音识别模型质量的反馈之礼
使用联邦学习的方法,从设备端用户的纠正中持续学习以解决自动语音识别模型在识别新时代术语方面的过时和陈旧问题。实验评估表明,该方法能够提高模型对新时代术语的识别能力,并保持整体语言分布的质量。
- 审视滥用语言检测中的时间偏见
在线辱骂言语的使用已成为一个日益普遍的问题,对个人和社会造成损害,其影响从心理伤害一直升级到现实暴力甚至死亡。该研究旨在调查在不同语言中的辱骂言语检测中时间偏差的性质和影响,并探索缓解方法。我们评估了不同时间段辱骂数据集上的模型性能。我们的 - 交流中符号出现的模型:概念回顾与避免局部最小值的指南
该研究介绍了计算机模拟在语言演化、认知科学、机器学习、机器人等领域的应用,提出了几种代表性模型的论点和已知结论。研究发现一些假设和方法限制了模型的成功,认为应重视身体和环境对智能体的影响,并以此为基础,提出了将符号系统建立在行动、知觉以及抽 - COLINGTempoWiC:社交媒体中检测意义转变的评估基准
本文介绍了一个新的基准测试 (TempWiC) 用于加速探索社交媒体中词义漂移现象的研究,结果表明其对于当前专门针对社交媒体的语言模型的挑战性较大。
- ACLSlangvolution: 俚语中语义变化和词频动态的因果分析
通过因果关系的镜头来研究语言的演变,我们分析了俚语词和非俚语词的语义变化和频率转移,发现俚语词虽然语义变化较小,但频率转移较大。
- EMNLP跨语言和同一语言中的惊奇度 - 持续时间权衡
研究发现,人类认知塑造了语言的演变和使用,600 种语言的语料库证实了超出和内部有惊讶 - 持续时间权衡的存在,结果是在不同语言中,更少惊讶的音位生成速度更快,反之亦然,并且确认了 319 种语言中更惊讶的音位平均更长。
- EMNLP高效信息传递和输入变异对神经代理迭代语言学习的影响
该研究发现,在使用神经网络代理进行迭代语言学习的近期模拟中,并不存在诸如词序或屈折等表达句法结构的不同策略间的权衡。然而,这一研究发现在考虑到偏向于高效传达、不系统的输入语言和学习瓶颈等三个因素后得到了重新评估,并发现神经网络代理主要努力保 - 学习合作:多智能体导航中的新兴通信
本研究探讨了人工智能代理的紧急沟通现象以了解其语言演化,发展出能够与人类有效沟通的人工智能系统,发现代理人在不同网格环境下进行合作导航任务时,学习了解释性的沟通协议,使其能够高效地解决任务,分析了代理人的策略,发现紧急信号在空间上聚集在一起 - AAAI探索紧急通信中的图表示学习
本文利用图卷积网络支持多智能体系统中语言和合作的进化,并提出了一个具有不同复杂性的图形指称游戏,并提供了强基准模型,展示了出色的语言演化和合作特性。
- 建模语义变化生成时间线
本研究同时使用静态和时变词嵌入来衡量事件对词汇的影响,通过创建历史转折点的时间轴来了解目标词的演化,定量评估结果表明这种技术可以捕捉语义变化和事件影响。
- AAAI回到未来 -- 文本表示的顺序对齐
本研究探讨了语言演化之对于机器学习模型的影响,提出使用序贯对齐学习表示来处理数据漂移的方法,并在多个任务上取得优异的效果。
- 工具小姐和水果先生:智能体对物体可供性学习中的紧急交流
从人的语言进化角度出发,研究深度网络代理在共同任务中的交流方式,发现当存在自然物体特征和参与者之间存在全对称关系时,代理可以通过真正的双边引用通信解决共同任务,但代理之间会有多重表达方式,导致全对称并不足以促使共同语言的形成。
- EMNLP多智能体通讯游戏中的紧急语言现象
本文提出了使用深度强化学习进行训练的带有通信能力的智能体在同时进行一系列指称游戏的计算框架,证明了框架反映了自然语言中观察到的语言现象,即语言演化的复杂属性可以不依赖于复杂的语言能力而是可以从视觉感知智能体之间的简单社交交流中产生。
- ACL随时间演变的词嵌入揭示语义变化的统计规律
通过评估 PPMI,SVD 和 word2vec 等词嵌入模型来量化语义变化的方法,我们提出并验证了语义演化的两个定量化规律:与频率呈反幂律相关的语义变化率规律和与多义性无关的语义变化率规律。
- 英语的积极性
本文研究自然语言情感色彩的积极偏向性及其形式分布规律,并对四个大型语料库的情感词性进行量化和分析。