UniPoll:一个通过多目标优化实现统一的社交媒体投票生成框架
本文提出了一个神经网络的方法,该方法应用核心指代知识来产生覆盖单句以外内容的维基百科相关问题-答案对,并通过对一百万个这些问题-答案对的定性分析表明了该系统的有效性。
May, 2018
本文通过分析提及不同人群的信息生成的文本,系统研究了自然语言生成中的偏见,并引入了关于群体态度的概念,使用不同群体态度的不同水平作为自然语言生成偏见的定义度量,并分析情感分数在关于群体态度的代理度量方面的相关性。同时,通过收集 strategically-generated text,手动注释文本并构建自动态度分类器来分析未见过的文本中的偏见程度,揭示了语言模型生成的偏见性质。研究提供了关于自然语言生成偏见、偏见度量和相关人类判断的研究以及我们注释的数据集的实证证据。
Sep, 2019
该研究提出了一种新的框架来帮助读者识别新闻来源的异同,基于 discord 问题生成,强调了新闻报道的多样性,提高了当前问答生成方法的性能,并通过一个原型界面展示了该框架的可行性。
Nov, 2022
本文研究了利用大型语言模型(LLMs)来增强调查的三种不同应用程序:缺失数据插补,回溯预测和零-shot预测。该论文提出了一个新的方法论框架,其中包含民意调查问题,个人信念和时间背景的神经嵌入,以个性化LLMs的意见预测。该研究表明,LLMs表现出较低的精度,但最佳模型的准确率在意识形态上明显更高,可以用于填补缺失的趋势并确定公众态度的变化。但是,模型在zero-shot预测任务中的表现有限,强调了LLMs的挑战。
May, 2023
本文运用自然语言处理技术对推特数据进行情感分析和主题建模,研究公众对ChatGPT的态度,发现总体上态度中立到正面,人工智能、搜索引擎、教育、写作、问答等是推特中提到度最高的话题。
Jun, 2023
由于一次导致互联网使用增长70%的大流行病,全球范围内使用社交媒体的人数大幅增加。本研究通过使用词嵌入来分析评论中的组成部分和文档,调查了不同社交媒体平台上的情感和语义关系,论述了共享意见在这些不同媒体平台之间的重要性,为研究人员、政治家和商业代表提供跟踪全球用户共享情绪的路径。本研究呈现了多种测量从这些热门在线平台上提取的文本相关性的方法,通过利用捕捉语义关系的词嵌入来分析网络上的情感,我们可以揭示公众舆论作为一个整体的联系。该研究利用了来自YouTube、Reddit、Twitter等的现有数据集,并利用了像双向编码器表征来自变形器(BERT)等热门自然语言处理模型来分析情感和探索评论嵌入之间的关系。此外,我们还将利用聚类和Kl散度来发现不同社交媒体平台上这些评论嵌入之间的语义关系。我们的分析将使人们更加深入地了解在线评论之间的相互关联,并探讨互联网作为一个庞大的相互连接的大脑的概念。
Sep, 2023
社交媒体及其新闻推送算法对于提升构建性对话具有挑战性,本研究使用大型语言模型和基于代理模型的仿真来研究不同的新闻推送算法如何影响在线对话质量,发现新推送算法能够促进跨政治观点的建设性、非有害对话。
Oct, 2023
通过使用新闻媒体偏见和帖子内容来标记社交媒体帖子的两种启发式方法,以及与随机抽取的人工标注数据集进行比较,我们展示了当前机器学习模型在预测社交媒体帖子的政治倾向方面的改进性能,采用传统的监督学习和少样本学习设置。
Nov, 2023
通过使用基于人口分布的人口组别信息,我们研究了语言模型在生成与人群相符合的调查回复方面的可行性,并揭示了语言模型中的社会偏见对这类模拟的影响。
Feb, 2024
通过引入基于生成式大型语言模型的Generator-Guided Estimation Approach (GGEA)来预测社交媒体帖子的到达率,这是一个显著的进展。
Mar, 2024