利用 BERT 分析短社交媒体文本中的性别极性:表情符号的作用
本文基于智能手机用户使用表情数据集,探究性别间表情使用方面的差异,研究发现性别在表情使用上显著不同,并构建机器学习算法基于表情推断用户性别,从而提供一种非文本或语境信息的用户性别推断模型,克服文本和元数据对用户隐私的泄露风险。
May, 2017
本研究提出了一种基于 BERT 的 transformer 方法来预测文本中最合适的 emoji 表情符号,实验结果表明我们的方法的准确性高于其他几种先进的模型,这个方法有潜在的在自然语言处理、情感分析和社交媒体营销的应用。
Jul, 2023
利用 GPT-4 和基于 BERT 模型的多模态情绪分析,通过将表情符号转化为可量化的情绪数据,将其与 BTC 价格和 VCRIX 指数等关键市场指标相关联,从而开发出基于社交媒体元素的交易策略,帮助识别和预测市场趋势,避免重大市场下滑并促进回报稳定。
Feb, 2024
本文提出基于 transformers 的模型,从社交媒体用户的图像和推文中预测其性别,从而解决性别信息不公开的问题,同时,图像分类和文本分类模型能够相互支持,提高整体分类准确率。
Apr, 2022
本文研究了在社交媒体情感分析任务中使用二进制表情符号和特定的话题标签作为远程监督的方法,通过扩展对更多嘈杂标签的监督,模型可以学习更丰富的表示,同时从一个包含 64 个常见表情的数据集中进行表情预测,使用单个预训练模型在 8 个基准数据集中取得了最先进的性能,并证实了我们的情感标签多样性相较于之前的远程监督方法有了更好的表现。
Aug, 2017
本文研究社交媒体中 emoji 图标的情感分类问题,并探讨了不同的多模态官能(文本、emoji 和图片)在此问题中的作用,结果表明三种官能可互补,最高准确度达到 71.98%。
Mar, 2019
本文分析 Bert 模型的性别偏见,并引入一种新的偏见度量,通过在训练管道中系统地改变元素来综合分析 BERT 的偏见,发现几乎所有条件下都存在重大的性别偏见,结果表明这些偏见源于公共 BERT 模型而非任务特定数据,强调了负责任的使用的重要性。
Jun, 2023
本文采用基于转换器模型和双向 LSTM 网络的方法,结合心理语言学特征进行基于文本的情感检测,在两个基准数据集中表现出可比性,在六个统一情感数据集的迁移学习实验中表现出强大的跨领域泛化功能。
Dec, 2022
使用 BERT 模型对 SemEval2017 中 Twitter 上的英语情感分析任务 4A 进行解决,在训练数据量较小的分类任务中,BERT 是一个非常强大的大型语言模型。使用此模型进行实验时,我们使用了包含 12 个隐藏层的 BERT BASE 模型,该模型在准确性、精确率、召回率和 F1 分数上优于朴素贝叶斯基线模型,在二分类子任务中表现更好,我们还在实验过程中考虑了所有种类的伦理问题,因为 Twitter 数据包含个人和敏感信息。我们在此 GitHub 存储库中提供了实验中使用的数据集和代码。
Jan, 2024