Feb, 2023
在测试语言不常见方面的人工智能性能时,暴露对底层意义的不敏感性
Testing AI performance on less frequent aspects of language reveals
insensitivity to underlying meaning
TL;DR本研究探讨基于计算方法和大数据的人工智能应用中所使用的大型语言模型的语言表现,着重考察语言表现是否由语言知识所导引。结果发现即便是常规语法结构之外的、不太常见的语言结构也可能导致大型语言模型表现出不足的语言能力,暗示这种类型的语言模型实际上并不像人类一样具有对语言的深入理解。