ACLJun, 2023

预训练语言模型在日语敬语转换上的句法泛化能力分析

TL;DR本研究旨在探讨预训练的大型语言模型是否可以像人类一样处理日语敬语。通过引入一项敬语转换任务,从不同句型的问题模板构建了一个日本敬语数据集,并测试了一个领先的大型语言模型 GPT-3 在此任务上的句法泛化能力。结果表明,在上下文敬语转换任务上,经过微调的 GPT-3 表现比基于提示的 GPT-3 更优秀。但当测试涉及直接言语的数据时,微调模型的句法泛化能力下降。