Oct, 2023

BanglaNLP 在 BLP-2023 任务 1 中:对孟加拉语中激发暴力的文本检测进行不同的 Transformer 模型评估

TL;DR本研究通过开发系统解决孟加拉暴力煽动文本检测的共享任务,探讨了我们所采用的传统和最新方法,该系统有助于分类给定文本是否包含威胁。实验研究了在有限数据集情况下数据增强的影响,定量结果表明,与其他基于变压器结构的模型相比,微调多语言 - e5 基础模型在任务中表现最佳。 在测试集中,宏 F1 得分达到了 68.11%,并且在该共享任务的排行榜中排名第 23 位。