UnibucKernel Reloaded:两年连续获得阿拉伯方言辨别竞赛第一名
一篇介绍用于 2017 年原生语种识别共享任务的机器学习方法的论文,该方法组合了几个内核(包括从文章或演讲转录中提取的字符 p-grams 和音频记录的低维表示),并使用核判别分析(KDA)来分类。使用该方法,研究团队在不同的竞赛分类中获得了优异的得分(达到了最好的口语和混合跟踪的得分),证明了该方法的有效性。
Jul, 2017
本文研究了使用简单而有效的传导学习方法以及自我训练方法来优化字符串核技术在一些文本分类任务中的表现,并通过将字符串核适应于测试集中的样本,取得了在英语情感极性分类和阿拉伯语方言识别中显著更好的准确率。
Aug, 2018
本篇论文描述了一个用于阿拉伯语的口语方言识别 (ADI) 模型,该模型在两个基准数据集 ADI-5 和 ADI-17 上始终表现优于先前发表的结果。我们探索了两种不同的架构变体:ResNet 和 ECAPA-TDNN,以及两种类型的声学特征:MFCC 和从预训练的自监督模型 UniSpeech-SAT Large 提取的特征,以及所有四个变体的融合。我们发现,ECAPA-TDNN 网络表现优于 ResNet,而具有 UniSpeech-SAT 特征的模型远远优于具有 MFCC 特征的模型。此外,所有四个变体的融合一致优于单个模型。我们的最佳模型在两个数据集上的准确率分别为 84.7% 和 96.9%,超过了先前报道的结果。
Oct, 2023
本文介绍了 Mawdoo3 AI 团队开发的预训练 BERT 模型的表现,以及该模型在 Nuanced Arabic Dialect Identification(NADI)共享任务的子任务 1 中获胜的过程和方法,并公开了 Multi-dialect-Arabic-BERT 模型的预训练语言模型组件,供其他研究人员使用。
Jul, 2020
该研究提出了对 “Nuanced Arabic Dialect Identification (NADI) Shared Task 2023” 的方法,着重介绍了处理与国家级方言识别相关的子任务 1 的方法。该研究利用使用涵盖 18 种方言的 Twitter 数据集(TWT-2023)进行多类别分类问题的研究,采用基于 transformer 的预训练模型进行国家级方言识别,并利用集成方法提高了系统的性能,在测试数据集中取得了 76.65 的 F1 得分(排名第 11 位)。
Nov, 2023
该研究针对阿拉伯方言识别的国家级方言识别这一子任务,对表面预处理、形态预处理、FastText 向量模型和 TF-IDF 特征的加权拼接等多个关键因素进行深入分析,使用线性支持向量分类(LSVC)模型进行分类,并取得了显著成果,F1 得分为 62.51%,接近于该子任务所提交其他系统的平均 F1 得分 72.91%。
Dec, 2023
Automatic Arabic Dialect Identification (ADI) 系统无法准确区分阿拉伯语的微方言,我们建议将 ADI 任务构建为多标签分类任务并提供设计新的 ADI 数据集的建议。
Oct, 2023
本文研究使用语音识别系统获得的音位、词汇特征以及基于 i - 向量框架的声学特征等不同方法来进行阿拉伯语方言识别的研究,使用多类支持向量机(SVM)综合这些特征,并在阿拉伯语 / 英语语言识别任务中获得 100%的准确率。在本研究中,我们使用这些特征作为二元分类器来对现代标准阿拉伯语(MSA)和方言阿拉伯语进行区分,获得了 100%的准确率,然后进一步报道了使用该方法来区分最广泛使用的阿拉伯语方言中的五种:埃及语,海湾语,黎凡特语,北非语和 MSA,准确率为 52%。本文讨论了方言识别的错误以及在方言阿拉伯语和 MSA 之间进行语言代码切换的上下文中的错误模式。最后我们释放了研究中使用的数据作为方言识别的标准语料库。
Sep, 2015
通过自监督学习模型、迁移学习和直接分类器,对阿拉伯语方言识别系统进行评估,研究其在领域漂移情况下的鲁棒性,并发现自我训练虽能减轻此类挑战,但在实际应用中可能不足够。
Jun, 2023
通过进行现场访问与记录,我们获得了 6 个次方言的 29 小时、16 分钟和 40 秒的音频记录,应用了三种深度学习模型(ANN,CNN 和 RNN-LSTM),并比较了它们的性能,发现 RNN-LSTM 模型表现最佳,准确率达到 96%。
Mar, 2024