单模态中间训练用于多模态的迷因情感分类
本文探讨了使用自然语言处理和计算机视觉技术进行情感分析的问题,研究人员使用双模态和单模态的方法,提出了一种使用 Word2vec 嵌入的前向神经网络的文本单模态方法,在情感分类任务中相对于其他方法有 63%的改进。
Jul, 2020
本篇研究提出一种多模态半监督学习方法,可用于探测社交媒体上的恶意图片,该方法结合了自动编码器和分类任务,通过 Contrastive Language-Image Pre-training 实现。在两个数据集上,该方法表现优于其他多模态半监督学习和有监督学习的现有模型。
Mar, 2023
本研究提出了一种使用深度学习方法进行多模态表情包分类的特征提取方法。通过使用不同的多模态神经网络方法进行多模态特征提取,我们可以训练出一个分类器来识别表情包中的情感。
Jul, 2022
本文介绍了一种利用图像字幕工具引入自动字幕以模拟图像内容和遮盖文本间的对比,在处理讨论是否具有仇恨色彩的 “违反社交规范” 的表情包挑战中,可以改进单模型和多模型。同时,在处理单模型中,继续在增强和原始字幕对上进行预训练,对于分类准确性有很大的益处。
Sep, 2021
该研究提出了一个新的挑战,针对多模态模因素进行分类,专注于检测多模态模因素中的仇恨言论,并构造了一个难以依靠单模态信号的数据集,要求进行微妙的推理,证明了该任务的难度,并强调这个重要问题对社会的挑战。
May, 2020
本文针对当前因网络平台被用于地缘政治事件和社会问题而使得互联网谣言的信息审核变得更加困难,旨在设计实现一个多模态分类方法,利用文本和图像来识别有害的网络谣言,通过举例和原型推理比较示范算法之间的性能差异,为社区提供启发,同时设计一种用户友好的界面以方便对比分析结果。
Dec, 2022
本研究采用 ResNet50 和 BanglishBERT 的多模态方法,在低资源语言(如孟加拉语)的 memes 情感分析中取得了令人满意的 0.71 的加权 F1 分数,并通过可解释人工智能(XAI)技术对模型的行为进行解释性分析。
Dec, 2023
本文探讨在 Facebook Meme Challenge 中通过多模型和目标检测、图像说明和情感分析等技术的结合来解决恶意文本与图像的混淆问题以提高分类准确性。
Dec, 2020
本研究介绍了一个基于多模态特征和融合方法的计算模型,使用 XLNet 取得最高的加权 f1 分数 0.58,并在对多模态社交媒体 meme Troll 的分类任务中获得第三名。
Feb, 2021