- ACL评估词汇融入对于抑郁症状估计的效果
探索将情感、情绪和领域特定的词表融入基于 Transformer 模型的抑郁症状估计中的影响。通过标记患者 - 治疗师对话的输入转录和社交媒体帖子中的单词来添加词表信息。总体结果表明,在预训练语言模型中引入外部知识可以提高预测性能,而不同的 - 归属于谁的 LLM?GPT-3.5、GPT-4 和 Bard 的语言比较与 LLM 归属
通过语言分析,对比了目前三种最流行的大型语言模型(GPT-3.5、GPT-4 和 Bard)生成的文本与不同输入的词汇、词性分布、依存分布和情感,结果显示存在显著的语言变化,通过简单的模型分类可以以 88% 的准确率将文本归属于相应的大型语 - 新冠疫苗的 Twitter 情绪分析
使用自然语言处理技术,我们旨在以最高的准确率确定和分类关于 COVID-19 疫苗的观点。
- 对话中利用部署数据的隐式反馈
通过学习用户与已部署模型之间的自然对话,我们研究了提高社交对话代理的方法,无需额外的注释。利用用户响应长度、情感以及未来人类发言中的反应等信号来隐式衡量机器生成发言的质量。我们的实验使用了 BlenderBot(Xu 等,2023 年)的公 - 基于量子概率的联合多模态讽刺、情感和情绪分析框架
本文提出一种基于量子概率的多模态讽刺、情感和情绪分析框架(QUIET),通过在两个数据集上进行大量实验,证明了 QUIET 与现有技术相比的有效性和优越性,并展示了量子概率在多情感分析中的巨大潜力。
- MuSe 2023 多模态情感分析挑战赛:模拟情绪、跨文化幽默和个性化
该研究介绍了 MuSe 2023 的数据集、子挑战和提供的特征集,其旨在聚集来自不同研究领域的广泛受众,如视听情感识别、自然语言处理、信号处理和健康信息学,在多模态情感和情感分析方面提出了三个不同的子挑战,包括模仿情感、跨文化幽默检测和个性 - 下雨天我们在推特上谈论哪些食物?
本研究探讨拉脱维亚的一组推文数据集,以及关于不同天气条件下的平均温度,降雨量和其他现象的天气观测数据集。我们发现具体的天气条件带来了特定的食品信息分享,并自动分类推文情感,并讨论其与天气的关系。研究对大规模社交网络数据理解食品消费者的选择和 - 利用新闻标题研究新闻传播障碍的特征
利用 COMET 推理模型和新闻标题的情感,通过采集和标记新闻标题的元数据来检测新闻传播中的文化、经济、政治、语言和地理障碍,并将提取到的语义知识和情感作为特征,相对于传统文本分类方法和深度学习可获得更好的表现(对于文化、经济、政治和地理的 - 技术对社会重要领域的影响及与人类的比较
通过比较人类和机器在不同情境下的情感、表现和影响等方面,以了解技术的社会影响,权衡技术利弊如何决定技术是否应该投入使用。
- EMNLP走向程序公正:揭示有毒语言分类器使用情感信息中的偏见
研究了毒性语言分类器的公正性,考虑了与身份术语之外的重要概念的交互作用,表明身份术语将其它输入特征的作用超越,所得知识可指导去偏见技术以确保训练集中重要概念的充分代表。
- 利用情感和常识进行零样本立场检测
文章提出一种包含情感、常识知识,并使用图自编码器模块获得常识知识的态度检测模型,通过在零样本设置下比较,研究结果显示该模型在 VAST 基准数据集上的表现优于现有最先进的方法。
- 巴尔干半岛议会辩论情感标注数据集:波黑,克罗地亚和塞尔维亚
考察了东南欧三个国家国会辩论中发言情感色彩的分类方法和效果,通过样本数据得出了最优分类模型。
- 基于提示的人格和人际反应预测系统
利用预训练语言模型的提示学习方法,采用数据增强和模型组合,实现了计算机对主观性、情感和社交媒体分析领域的个性预测任务,同时提供了在线软件演示和代码的方便研究。
- 2022 年俄乌危机 Twitter 数据集
研究表明,社交网络在危机期间扮演了重要的信息交流角色,可反映大规模公众舆论和情感,同时也可用于研究不同实体所采用的宣传舆论工具及其传播效果。作者提供了 2022 年俄乌危机期间 Twitter 数据集,包含 1.6 万条推文,时间跨度为危机 - 2020 年美国选举中 COVID-19 推文情感与投票偏好的转变趋势
研究通过分析推特数据发现,不同阵营的州在 COVID-19 相关政策的推特情感方面存在差异,这一差异可能对 2020 年美国大选的结果起到一定的影响。
- KDD基于 EDU 层面注意力的方面情感分析
该论文提出了一种基于 EDU 边界的句子建模方法,旨在克服句子同时表达多个方面情感极性的问题。该模型通过在单词和 EDU 级别上进行稀疏注意力,突出表达情感的单词,并使用 EDU 级别稀疏注意力和正交正则化来确保模型在适当的 EDU 上关注 - AAAI一种基于嵌入的短文本情感 - 主题联合模型
本文提出 ELJST 模型,可从短文本中挖掘语义情感和主题,具有更好的主题连贯性和多样性,有助于更好地理解用户行为,为服务和医疗行业提供显著价值。
- 当代议题倾向性预测:数据与实验
研究使用预训练的双向变压器和情感信息,以改进对当代问题长时间讨论的立场检测,并创建一个新的含有情感信息的数据集,该数据集可用于浅层递归神经网络在低参数下达到了与经过微调的 BERT 相同的结果,同时使用简单的方法解释了哪些输入短语对于立场检 - EMNLP序列对序列变分自编码器是否能学习句子的全局特征?
研究使用解码器作为全局信息捕捉的替代性结构,以改善深度变分自编码器的范围控制缺乏问题,并使用重构来证明这些结构提供了更多的全局功能。
- 生成具备可控语义的多样化故事延续
我们提出了一个控制生成多个不同输出的简单有效建模框架,重点考虑了情感、长度、谓语、语义框架和自动诱导簇等几个句子属性。我们的实验结果表明:(1) 我们的框架在产生与目标控制值匹配的输出方面非常准确;(2) 与标准的 n-best 列表生成相