Apr, 2024

一句好的俏皮话的妙趣自成良词:大型语言模型是否能理解俏皮话?

TL;DR本论文通过采用三个主要任务,即识别、解释和生成双关语,系统评估了大型语言模型在双关语理解方面的能力,新的评估方法和指标更加贴近人类认知,发现了“懒散双关语生成”模式以及大型语言模型在双关语理解中遇到的主要挑战。