Apr, 2024

大型语言模型中的范围模糊性

TL;DR研究了不同版本的自回归语言模型(GPT-2,GPT-3/3.5,Llama 2 和 GPT-4)如何处理涉及语义操作符的语义模糊句子,并与人类判断进行比较。发现几个模型对这些句子中的含义模糊很敏感,与人类判断相吻合,并且能够以高准确度(某些情况下超过 90%)识别出人类首选的解读。