May, 2024
基于预训练大型语言模型的乌尔都自然语言处理任务潜力评估
Benchmarking Pre-trained Large Language Models' Potential Across Urdu
NLP tasks
TL;DR利用零样本学习对四种主要的神经网络模型在14个乌尔都自然语言处理任务上进行了全面对比和分析,结果表明最先进的模型在所有任务中都超越了编码器-解码器的预训练语言模型。此外,研究还发现,基于较少参数但更多语言特定数据的模型比基于更大计算模型但较少语言数据的模型表现更好。