- 声音未听到:为约鲁巴地区方言提供的自然语言处理资源和模型
用高质量的平行文本和语音语料库 (YORÙLECT) 跨三个领域和四个地区的尼日利亚约鲁巴语方言开展研究实验,结果表明,标准尼日利亚约鲁巴语和其他方言在机器翻译、自动语音识别和语音到文本翻译等任务中存在明显的差异,在方言自适应微调的情况下, - 探索基于能量模型的方言识别的非分布检测
本研究介绍了一种针对方言的新型边界增强联合能量模型(MEJEM),用于方言中的 OOD 检测。通过集成生成模型和能量边界损失,我们的方法旨在增强方言识别系统的鲁棒性。此外,我们探索了两种 OOD 得分的方言检测方法,研究结果明确表明能量得分 - ACL通过多任务学习解开方言与社会偏见以提高公平性
方言、自然语言处理方法、偏见语言、公平性和多任务学习的关键字;使用多任务学习可以提高公平性,并更可靠地检测偏见语言的特性。
- 通过可解释的方言分类器提取方言的词汇特征
通过使用可解释的方言分类器,无论是否有人类专家,我们提供了一种提取方言区别词汇特征的新方法,并在普通话、意大利语和低萨克森语上进行实验,实验证明我们的方法成功地识别了导致方言变异的关键语言特定词汇特征。
- 方言使用者的需求调查:对德语方言的语言科技态度调查
调查表明,使用方言输入的潜在自然语言处理工具受到说方言的德语方言和地方语言使用者的欢迎,而方言输出的应用(如机器翻译或拼写检查)则不太受欢迎。
- 某一语言方言的自然语言处理:一项调查
该论文调查了自然语言处理中方言的重要性,描述了不同方言数据集和方法,对方言的研究超过了仅仅方言分类的工作,对构建具有公平性的语言技术有重要意义。
- OSN-MDAD:在线社交媒体上阿拉伯多方言对话的机器翻译数据集
通过翻译英文推文到阿拉伯文的海湾、也门、伊拉克和黎凡特方言,我们构建了一个在线社交网络基础多方言阿拉伯文数据集,用以改善阿拉伯文多方言机器翻译系统的性能。
- 跨语法的句法变异:建模复杂自适应系统
该研究利用整个语法以及语法中的独立节点对方言之间的句法差异进行了系统建模,结果表明句法变异的重要部分是语法不同部分之间的相互作用,并且方言之间的相似性严重依赖于被观察的语法子集。
- 利用数据收集和无监督学习对突尼斯阿拉伯语混合语音自动识别的提升
本研究旨在解决突尼斯方言语音识别的挑战,通过采集和注释文本和音频数据,并探索自监督、半监督和少样本代码转换方法,使其在不同的突尼斯测试集中取得前沿成果,最终通过人工评估确保翻译的准确性,所提出的模型适用于突尼斯阿拉伯语、英语和法语的语言混合 - 用平衡语料库实现低资源语言方言包容性识别的探索
研究了影响语音自动识别(ASR)系统跨音系瓶颈的爱尔兰三个主要方言的对比分析,结果显示平衡方言的语料库无法在方言之间产生相似的表现,这些结果将指导未来语料收集和系统构建策略以优化跨方言表现公正性。
- ACL汉语方言语音学的多方言表示学习
本文提供了一种从结构化音韵数据构建知识图谱,并应用于知识库学习中的 BoxE 技术,以获取汉语方言多音节表示的方法。
- 基于 N-Shot 的 Whisper 在多样化阿拉伯语音识别中的基准测试
本研究对 Whisper 在多种阿拉伯口音(包括几种没见过的口音)上进行了综合评估,结果发现 Whisper 在零 - shot 设置下性能较好,但在五种未见过的方言上性能明显下降。
- 自监督语音模型在北萨米方言识别中的应用
本研究通过特征提取和自监督表示法,成功区分处理了北萨米语的四个方言变体,并发现了主流语言对方言的影响。
- 基于混合物单调分解的无监督文档方言聚类
该论文提出了一种无监督分类方法,通过消费文件的程序生成的消息来将文件集分成不重叠的方言,并通过贪心算法演绎候选方言,旨在为分析人员减轻复杂格式的认知负荷。
- 阿拉伯语 Transformer 模型的事后分析
对在不同阿拉伯语方言上训练的 transformer 模型进行层与神经元分析,研究有趣的发现如下:①单词形态在较低和中间层次上学习,②句法依赖在较高层次上被捕获,③虽然 MSA 模型的词汇表与方言词汇表有很大重叠,但仍然无法捕捉阿拉伯语方言 - ACL了解自然语言理解中的方言差异
通过创建一个有挑战性的 GLUE 变体(VernAcular Language Understanding Evaluation (VALUE) benchmark),该研究介绍了一组词汇和形态变换规则,构造为 African Americ - EMNLP芬兰方言识别:音频和文本的影响
本篇论文介绍一种自动检测说话者方言的方法,结合录音文本与音频录音数据,对 23 种不同的芬兰方言进行分析,结果表明,该方法的准确度可达 85%。
- ACL低资源语言方言的机器翻译
提出了一种快速适应机器翻译系统生成不同于标准目标语言的语言变体的框架,通过对英俄翻译系统进行适应,可以生成乌克兰语和白俄罗斯语;适应英挪威博克马尔翻译系统可以生成尼诺斯克语;适应英语 - 阿拉伯语翻译系统可以生成四种阿拉伯方言,与竞争基线相 - MM利用博弈论分析辩解
本文研究辩解论理论在计算机科学中的应用,探究其与博弈论的关系,并研究了两种不同方言的辩解论理论(以图形和树形解释),以及建立了一个精确的标准来证明由辩解论理论引起的语义产生一致的结果。