Mar, 2024

从指令中预测第三方语言模型的性能

TL;DR在现代自然语言处理系统中,基于语言模型的指令跟随系统表现出越来越高的性能,但这些系统往往没有透明度,缺乏明确的性能限制,因此我们提出了一种第三方性能预测框架,通过训练一个独立的模型来预测在任务中评估指令跟随系统时的指标结果,从而揭示现代指令跟随自然语言处理系统的局限性。