Jun, 2024

在指令调优过程中的零样本泛化:相似性和粒度的见解

TL;DR使用多种度量标准首次证明了指导调整过程中的零样本泛化是一个基于相似性的从训练数据到测试数据的在实例级别上的推理表现,我们的分析有助于推动对指导调整过程中零样本泛化的理解,并为更加对齐的 LLMs 的发展做出贡献。