使用多磨坊主题分析方法的生育建议的实证研究
本文提出了一种基于NLP的框架,通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面,并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对21起大规模枪击事件中的4.4M条推文进行研究,发现这些事件的讨论在政治上高度极化。结果表明,共和党更关注枪手和事件特定事实,而民主党则更关注受害者和政策变化的呼吁。同时,作者还发现了一些引导言论极化的表达方式,诸如“基础事实”以及“恐怖分子”和“疯子”这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法,并提供了计算方法来研究这些现象。
Apr, 2019
通过引入数字方法和开放基础设施,结合因果关系的表达方式,本文介绍了一个实验性的观测站,用于从The Guardian.com的新闻评论中挖掘、分析和可视化信仰和观点。并通过探讨研究方法和基础设施的意义和影响,为研究新媒体环境下的意见动态和冲突做出了理论和实践贡献。
Dec, 2019
研究了社交媒体上普通民众如何表述移民政策议题,发现使用特定帧对话题更有针对性、更易引发用户参与,同时用户意识形态和地域也影响他们的话语选择和反应。此研究为自然语言处理和社科研究提供了新的贡献。
Apr, 2021
通过对155年德国政治辩论中对妇女和移民的支持进行测量,我们提供了一个1205个文本片段的支持标准,并使用BERT模型推断大规模趋势。我们的研究结果表明,德国社会在政治精英的支持下,变得更加公正。
Oct, 2022
本篇论文通过对 Twitter、Reddit、和 WebMD 等网络平台关于口服避孕药讨论内容的研究指出,网络平台的运用能更好地指引人们进行更复杂的医疗决策,并且强调了口服避孕药用户需要解决的相关问题。
Jan, 2023
本文介绍了一种利用自然语言生成技术进行社交媒体帖子自动生成投票的方法——UniPoll,该方法通过在帖子上下文中添加评论,采用多目标优化技术来增强上下文与投票之间的联系,并在大规模的中国微博数据集上展示了其显著优越性。
Jun, 2023
本文提出了一个针对社交媒体帖子进行处理的原型框架,旨在考虑市政决策。该框架通过以下三个步骤实现:(1) 确定每个社交媒体帖子的情感极性,(2) 识别流行主题并将其映射到各个帖子,以及(3) 将这两个信息合并成表示对每个主题表达的整体情感的模糊数。该框架在约两个月的时间里,使用捷克奥斯特拉发表的推文进行演示,展示了模糊数在更丰富方式中表示情感,以及捕捉社交媒体上表达的各种观点。
Aug, 2023
介绍了CIVICS数据集,该数据集旨在评估大型语言模型(LLMs)在多种语言和价值敏感的话题上的社会和文化变化。通过动态注释流程、定制提示设计和实验,调查了开放权重的LLMs对价值敏感问题的反应,研究了它们在不同语言和文化环境中的行为。CIVICS数据集旨在成为未来研究的工具,促进跨更广泛的语言环境的再现性和透明度,并进一步推动尊重和反映全球文化多样性和价值多元化的人工智能技术的发展。
May, 2024
研究考察了政治话题上的分歧是否与语言使用的独特模式有关,收集了 Reddit 上关于堕胎辩论的总共145,832条评论,分析了 r/prolife 和 r/prochoice 的子版块社群中的语言使用。通过考虑道德基础理论,分析了三种词汇模式,包括计算道德基础词典中词汇项目的比例频率,创建 n-gram 模型以揭示各立场群体常用的词汇搭配,以及使用潜在狄利克雷分配来识别语料库数据中的主题结构。研究结果表明,道德词汇的使用与对堕胎的立场相关联。
Jun, 2024
通过对1827个来自五个相关subreddit(r/OpenAI,r/technology,r/singularity,r/vfx和r/ChatGPT)的Reddit评论的主题建模分析,本研究揭示了围绕Sora的主题和叙述,其中包括AI对话的影响和趋势、公众意见和关切、与Sora进行艺术表达和视频创作以及Sora在媒体和娱乐中的应用等。本研究通过在线话语分析为了解公众对新兴生成型AI技术的看法提供了框架。
May, 2024