May, 2024

朝着更具包容性的人工智能:针对萨米语的大型语言模型训练的进展与展望

TL;DR该研究致力于解决 S'ami 语言面临的数字边缘化问题,通过采用最新的自然语言处理技术,训练基于超低资源语言的语言模型,并通过多语言训练实验,发现在顺序多语言训练情景下,解码器模型的表现优于联合多语言训练,且高语义重叠的多语言训练比从头训练要更好。