Apr, 2024

基于数据增强的方言调适对 LLMs

TL;DR该研究报告通过使用不同类型的语言模型并利用数据增强技术,提出了一种结合方法,旨在改善南斯拉夫南方微方言上大规模语言模型(LLMs)的通识推理能力评估,通过实验证明数据增强技术能够显著提升开源型模型类别在三个南斯拉夫方言(Chakavian、Cherkano 和 Torlak)的测试数据集上的性能,突出了数据增强的实际效用和 LLMs 在处理非标准方言方面的潜力以推进低资源和方言环境下的自然语言理解。