Jan, 2024

无人工指导的有限样本LLM自校准

TL;DR我们研究了如何在样本有限的情况下,通过使用上下文学习示例和迭代调整算法,自动对齐大型语言模型,以实现几乎不需要人工监督的自我泛化对齐能力。