Nov, 2023

功能学习与规范指令

TL;DR利用规范指令和测试套件,本文分析了功能学习的无微调方法,小模型很难遵循规范指令,但大模型(> 3B params.)能够从规范中受益并在不同功能上广义理想行为。