利用 BERT 分析短社交媒体文本中的性别极性：表情符号的作用

Jun, 2024

利用 BERT 分析短社交媒体文本中的性别极性：表情符号的作用

Analyzing Gender Polarity in Short Social Media Texts with BERT: The Role of Emojis and Emoticons

Saba Yousefian Jazi, Amir Mirzaeinia, Sina Yousefian Jazi

TL;DR本研究使用 BERT 对推特账户进行性别极性检测，并着重分析了表情符号和符号在模型分类任务中的影响。我们成功证明，在推特这种简短文本格式中使用非词语输入，以及提及其他账户，会对检测账户持有人的性别产生影响。

Abstract

In this effort we fine tuned different models based on bert to detect the gender polarity of twitter accounts. We specially focused on analyzing the effect of using →

tweet gender polarity bert emojis emoticons

发现论文，激发创造

透过性别镜头：从大规模 Android 用户中学习 Emoji 的使用模式

本文基于智能手机用户使用表情数据集，探究性别间表情使用方面的差异，研究发现性别在表情使用上显著不同，并构建机器学习算法基于表情推断用户性别，从而提供一种非文本或语境信息的用户性别推断模型，克服文本和元数据对用户隐私的泄露风险。

May, 2017

使用 Transformer 模型进行 Emoji 预测

本研究提出了一种基于 BERT 的 transformer 方法来预测文本中最合适的 emoji 表情符号，实验结果表明我们的方法的准确性高于其他几种先进的模型，这个方法有潜在的在自然语言处理、情感分析和社交媒体营销的应用。

Jul, 2023

基于表情符号的加密资产市场反应

利用 GPT-4 和基于 BERT 模型的多模态情绪分析，通过将表情符号转化为可量化的情绪数据，将其与 BTC 价格和 VCRIX 指数等关键市场指标相关联，从而开发出基于社交媒体元素的交易策略，帮助识别和预测市场趋势，避免重大市场下滑并促进回报稳定。

Feb, 2024

使用 Transformer 进行基于 Twitter 的性别识别

本文提出基于 transformers 的模型，从社交媒体用户的图像和推文中预测其性别，从而解决性别信息不公开的问题，同时，图像分类和文本分类模型能够相互支持，提高整体分类准确率。

Apr, 2022

从无监督的情感分析中创建表情符号词库

在线媒体产生了大量的非结构化数据，我们提出了一种新的方法来预测在线文本消息中表达的表情符号的情感，并构建了一个情感词典进行评估和比较。

Apr, 2024

使用数百万个表情符号出现次数来学习用于检测情感、情绪和讽刺的任意领域表示

本文研究了在社交媒体情感分析任务中使用二进制表情符号和特定的话题标签作为远程监督的方法，通过扩展对更多嘈杂标签的监督，模型可以学习更丰富的表示，同时从一个包含 64 个常见表情的数据集中进行表情预测，使用单个预训练模型在 8 个基准数据集中取得了最先进的性能，并证实了我们的情感标签多样性相较于之前的远程监督方法有了更好的表现。

Aug, 2017

多模态情感分类

本文研究社交媒体中 emoji 图标的情感分类问题，并探讨了不同的多模态官能（文本、emoji 和图片）在此问题中的作用，结果表明三种官能可互补，最高准确度达到 71.98％。

Mar, 2019

BERT 中的性别偏见 -- 通过情感评级测量和分析在现实下游分类任务中的偏见

本文分析 Bert 模型的性别偏见，并引入一种新的偏见度量，通过在训练管道中系统地改变元素来综合分析 BERT 的偏见，发现几乎所有条件下都存在重大的性别偏见，结果表明这些偏见源于公共 BERT 模型而非任务特定数据，强调了负责任的使用的重要性。

Jun, 2023

利用心理语言学特征和 Transformer 提升基于文本的情感检测的泛化能力

本文采用基于转换器模型和双向 LSTM 网络的方法，结合心理语言学特征进行基于文本的情感检测，在两个基准数据集中表现出可比性，在六个统一情感数据集的迁移学习实验中表现出强大的跨领域泛化功能。

Dec, 2022

SemEval-2017 任务 4: 使用 BERT 进行 Twitter 情感分析

使用 BERT 模型对 SemEval2017 中 Twitter 上的英语情感分析任务 4A 进行解决，在训练数据量较小的分类任务中，BERT 是一个非常强大的大型语言模型。使用此模型进行实验时，我们使用了包含 12 个隐藏层的 BERT BASE 模型，该模型在准确性、精确率、召回率和 F1 分数上优于朴素贝叶斯基线模型，在二分类子任务中表现更好，我们还在实验过程中考虑了所有种类的伦理问题，因为 Twitter 数据包含个人和敏感信息。我们在此 GitHub 存储库中提供了实验中使用的数据集和代码。

Jan, 2024