Dec, 2022

很少 ' 成问题吗?自然语言模型在预测上表现出与 ' 少量 ' 类量词相反的缩放

TL;DR语言模型在量化任务中表现较差,特别是在 Few-type 的量化词上,而且模型越大,表现越差。这暗示着越大的模型越倾向于反映在线而非离线的人类语言处理,并且这种表现下降可能挑战语言模型作为自然语言系统基础的应用。