COLINGMay, 2024

时代之符号:评估大型语言模型在成语辨析中的应用

TL;DR大型语言模型和仅编码器模型在处理可能包含习语的任务时的表现如何以及与之相比的性能状况被探究,结果显示尽管大型语言模型在不同尺度下都具有竞争力的性能,但其结果并不及细调为特定任务的模型,我们还发现模型规模的增加能够显著提高性能,并讨论了利用大型语言模型来解决这些任务的可行性。