- ACL解读叙事:分析在 Reddit 上分享的个人药物经历
在线社区、物质使用经历、多层次分类模型、GPT-4、PWUD 经历。
- 社群交叉指导:无监督指令生成用于将大型语言模型与在线社区对齐
利用大型语言模型和无监督框架,我们可以自动生成在线社区的指令 - 输出对,以代表其信念,从而实现对不同社区进行成本效益高且自动化的调查。
- 可解释性布局对人类对冒犯性句子的感知是否有影响?
本文通过用户研究评估三种机器学习 (Machine Learning) 可解释性布局对参与者评估包含仇恨言论的句子时的影响,重点关注 “厌女症” 和 “种族主义” 类别。通过问卷调查的统计和定性分析提供在线社区中使用机器学习可解释性的经验证 - 阅读推文之间:解读相互连接的混合意识形态社群的立场
该研究使用自然语言处理技术研究了 2020 年美国选举的 Twitter 讨论,通过比较语言模型生成的回复和真实调查结果,提出了一种新的方法来揭示相互关联的多样的意识形态社群中复杂的意识形态。
- 优化社交内容平衡以减少极化和分歧
通过重新加权用户关注的账户的相对重要性,我们提出了一种改善社交媒体中极端化和信息孤立化问题的新方法,以在相关性和多样性之间取得平衡,从而降低社交媒体的负面影响,同时保持信息流的质量。我们通过实验验证了这种方法的有效性,并证明其能够促进更健康 - 大规模协作活动中预测社区成功
在线社区的效力与成员间的动态之间的对应关系的研究,以 Reddit 的 r/place 为例,分析协同活动成功与不同因素之间的关系,为了解社区面对选举干扰或反科学趋势等在线社交威胁的韧性或脆弱性提供更好的理解。
- 一个仇恨女性的 Incel 论坛中的身份建构
本研究使用数量化文本和网络分析方法,研究了 incels.is 线上社区中,关于身份群体的讨论方式和使用的术语,发现这个社区生产了广泛的身份认同术语,其中提及的女性是最常见的,但其他少数群体的提及率也在上升,并发现了一种基于本质主义的意识形 - 通过大规模语言模型揭示网络社区中的偏见
本文利用自然语言生成中存在的偏见漏洞,探索了六个不同在线社区的偏见。通过对 GPT-Neo 1.3B 进行精细调整,该文评估了生成模型的偏见,并通过不同的人口属性来比较情感和毒性价值,从而揭示了各种模型的偏见类型和强度的差异。此外,本文所生 - 社交媒体文本中仇恨言论的自动翻译为非仇恨言论
本文提出一个新的翻译任务,将仇恨言论翻译为非仇恨言论的文本,同时保存其含义,以减少在线社区中仇恨言论的传播,本研究使用西班牙语文本作为案例研究,并提供了数据集和多个基线指标以便进行后续研究。
- 分析直播聊天中的规范违反
本研究着重于检测直播平台上的规范违规行为,通过人类用户的信息上下文建立模型可提高 35%的现场直播规范违规识别作用。
- CPL-NoViD: 在线社区违规检测的基于上下文提示的学习
本研究提出了一种使用基于提示的学习,用于检测在线社区中的规范违规行为。CPL-NoViD 通过自然语言提示将上下文融合到模型中,展示了对于不同类型的规则具有改进的性能,它不仅在跨规则类型和跨社区规范违反检测方面表现出色,而且在少样本学习场景 - 探究在线社区中的语言风格问题
本文研究社区语言的语言风格,通过分析 3 个社交媒体平台上涉及政治,电视和旅游的 9 个在线社区的 262 个特征来验证社区确实具有独特的风格,并发现语言风格是群体成员身份的良好预测器(F 值为 0.952,准确度为 96.09%),并且相 - DisinfoMeme:一种用于检测有意传播虚假信息的多模态数据集
本研究旨在帮助检测社交媒体上具有传播不实信息优势的迷因,研究人员构建了名为 DisinfoMeme 的数据集,覆盖了 COVID-19 大流行、黑人的命也是命运动以及素食主义 / 素食主义等三个流行话题,探讨了它们的特点,并在数据集上测试了 - 基于 BERT 的阿拉伯语攻击性语言检测系统微调方法
研究旨在通过应用最新技术,检测网络攻击性言论,保护在线社区成员并维护社会公正。通过对多个阿拉伯语攻击性言论数据集的微调,研究探究了微调对分类器的效果,结果表明,特别是在高方言评论方面,传递学习对分类器的性能有限影响。
- ACL探索在线支持论坛中自我认定的咨询专业知识
本文研究了精神健康相关的在线求助帖子中,自识别为精神健康专家与同龄人的回复差异,使用语言学分析探讨二者交互中的语言使用和互动特点,以期为理解健康专家在社交网络中与信息和支持寻求者的互动作出贡献。
- ACL在线社交网络结构调节词汇变化速率
本研究旨在探讨社交网络结构对词汇变化的影响,通过对 4420 个在线社区在 10 年内发生的 80,000 个新词汇的大规模分析,使用泊松回归和生存分析,发现社区的网络结构对词汇变化起着显著作用,特别是密集连接,缺乏本地集群和更多的外部联系 - 在线平台上社会组织和政治极化的量化
通过神经嵌入技术对 Reddit 14 年间 5.1B 评论的社区结构进行了研究,发现在 2016 年美国总统选举后,Reddit 出现了明显的政治极化,尤其是右翼用户的活动量增加导致的。个体级的极化是罕见的,政治极化可以通过考察单个用户的 - 为什么人们加入阴谋社群?:社会因素在阴谋参与中的作用
该研究分析了社会因素在阴谋论社区入会中的重要性,发现与阴谋社区成员之间的双人交互和边缘化是影响入会的最重要的社会前因,从而帮助我们更好地理解信息传递和什么因素影响了阴谋论的扩散,具有重要的民主制度和在线社区的影响。
- 利用新型 Twitter 数据集表征 COVID-19 虚假信息社群
针对 COVID-19 在线信息误导问题,本文分析并对比了在 Twitter 上两个竞争性的 COVID-19 信息社区:误导用户和知情用户,并通过网络结构分析、语言模式等方面对他们进行了表征和分类,发现误导社区较为紧密、有组织,并可能存在 - 分类建设性评论
本文介绍了 C3(Constructive Comments Corpus)语料库,包含 12,000 条经过注释的新闻评论,旨在帮助构建新的在线社区工具,以提高其讨论质量。通过定义建设性评论为对会话有所贡献的高质量评论,并通过定义建设性子