使用多磨坊主题分析方法的生育建议的实证研究

Jul, 2023

使用多磨坊主题分析方法的生育建议的实证研究

An Empirical Study on Fertility Proposals Using Multi-Grined Topic Analysis Methods

Yulin Zhou

TL;DR通过共现语义分析、主题分析和情感分析对微博评论进行多层次语义分析，发现关于＂取消出生登记的婚姻限制＂的讨论涉及个人、社会和国家三个层面，细分为个人行为、社会伦理和法律以及国家政策等社会问题，大多数话题中人们的情感倾向消极。基于此，提出了八项建议，为政府决策提供参考，并形成研究政治问题公众舆论的参考方法。

Abstract

fertility issues are closely related to population security, in 60 years China's population for the first time in a negative growth trend, the change of fertility policy is of great concern to the community. 2023

发现论文，激发创造

在社交媒体中分析极化趋势：以21起大规模枪击事件中的推文为例

本文提出了一种基于NLP的框架，通过分析话题选择、表达方式、情感和言语作用等四个维度来研究社交媒体中的政治极化。作者通过现有的词汇方法量化这些方面，并提出了利用聚类技术识别分析主题的方法。作者将这些方法应用于对21起大规模枪击事件中的4.4M条推文进行研究，发现这些事件的讨论在政治上高度极化。结果表明，共和党更关注枪手和事件特定事实，而民主党则更关注受害者和政策变化的呼吁。同时，作者还发现了一些引导言论极化的表达方式，诸如“基础事实”以及“恐怖分子”和“疯子”这两个术语的不同使用。该研究深入了解了语言中的群体分裂表现方法，并提供了计算方法来研究这些现象。

Apr, 2019

利用因果关系挖掘促进在线舆论动态：以《卫报》气候变化讨论为例

通过引入数字方法和开放基础设施，结合因果关系的表达方式，本文介绍了一个实验性的观测站，用于从The Guardian.com的新闻评论中挖掘、分析和可视化信仰和观点。并通过探讨研究方法和基础设施的意义和影响，为研究新媒体环境下的意见动态和冲突做出了理论和实践贡献。

Dec, 2019

社交媒体上移民话语框架建模

研究了社交媒体上普通民众如何表述移民政策议题，发现使用特定帧对话题更有针对性、更易引发用户参与，同时用户意识形态和地域也影响他们的话语选择和反应。此研究为自然语言处理和社科研究提供了新的贡献。

Apr, 2021

FairGer：使用NLP测量155年德国议会辩论中对妇女和移民支持情况

通过对155年德国政治辩论中对妇女和移民的支持进行测量，我们提供了一个1205个文本片段的支持标准，并使用BERT模型推断大规模趋势。我们的研究结果表明，德国社会在政治精英的支持下，变得更加公正。

Oct, 2022

在线平台上关于避孕方法的意义生成

本篇论文通过对 Twitter、Reddit、和 WebMD 等网络平台关于口服避孕药讨论内容的研究指出，网络平台的运用能更好地指引人们进行更复杂的医疗决策，并且强调了口服避孕药用户需要解决的相关问题。

Jan, 2023

UniPoll：一个通过多目标优化实现统一的社交媒体投票生成框架

本文介绍了一种利用自然语言生成技术进行社交媒体帖子自动生成投票的方法——UniPoll，该方法通过在帖子上下文中添加评论，采用多目标优化技术来增强上下文与投票之间的联系，并在大规模的中国微博数据集上展示了其显著优越性。

Jun, 2023

社交媒体、主题建模与情感分析在市政决策支持中的应用

本文提出了一个针对社交媒体帖子进行处理的原型框架，旨在考虑市政决策。该框架通过以下三个步骤实现：(1) 确定每个社交媒体帖子的情感极性，(2) 识别流行主题并将其映射到各个帖子，以及(3) 将这两个信息合并成表示对每个主题表达的整体情感的模糊数。该框架在约两个月的时间里，使用捷克奥斯特拉发表的推文进行演示，展示了模糊数在更丰富方式中表示情感，以及捕捉社交媒体上表达的各种观点。

Aug, 2023

CIVICS：在大型语言模型中构建一个用于研究文化信息价值观的数据集

介绍了CIVICS数据集，该数据集旨在评估大型语言模型（LLMs）在多种语言和价值敏感的话题上的社会和文化变化。通过动态注释流程、定制提示设计和实验，调查了开放权重的LLMs对价值敏感问题的反应，研究了它们在不同语言和文化环境中的行为。CIVICS数据集旨在成为未来研究的工具，促进跨更广泛的语言环境的再现性和透明度，并进一步推动尊重和反映全球文化多样性和价值多元化的人工智能技术的发展。

May, 2024

极化与道德：对Reddit关于堕胎话语的词汇分析

研究考察了政治话题上的分歧是否与语言使用的独特模式有关，收集了 Reddit 上关于堕胎辩论的总共145,832条评论，分析了 r/prolife 和 r/prochoice 的子版块社群中的语言使用。通过考虑道德基础理论，分析了三种词汇模式，包括计算道德基础词典中词汇项目的比例频率，创建 n-gram 模型以揭示各立场群体常用的词汇搭配，以及使用潜在狄利克雷分配来识别语料库数据中的主题结构。研究结果表明，道德词汇的使用与对堕胎的立场相关联。

Jun, 2024

使用主题建模分析开放AI的文本-视频模型'Sora'的公共话语

通过对1827个来自五个相关subreddit（r/OpenAI，r/technology，r/singularity，r/vfx和r/ChatGPT）的Reddit评论的主题建模分析，本研究揭示了围绕Sora的主题和叙述，其中包括AI对话的影响和趋势、公众意见和关切、与Sora进行艺术表达和视频创作以及Sora在媒体和娱乐中的应用等。本研究通过在线话语分析为了解公众对新兴生成型AI技术的看法提供了框架。

May, 2024