Jul, 2024

LLMs作为函数逼近器:术语、分类和评估问题

TL;DR自然语言处理从建模特定任务快速转向使用更一般的预训练模型,并将其微调为特定任务,现在我们似乎拥有了本质上具有广义模型特性的模型。本文认为这种模型模型失去了清晰度,导致了与其评估优点和缺点无关的类似“人工通用智能”的隐喻,因此建议从其近似专家功能的能力出发看待其广义性和潜在价值。这种视角引发了关于近似质量的问题,以及发现性、稳定性和保护性的问题。如本文所示,这种框架将实践和理论视角的各个方面以及常常被次要化的问题(如“提示注入”和“越狱”)融合在一个概念框架中。