Apr, 2024

大型语言模型中高效利用学习

TL;DR通过引入 “Leverage Learning” 方法,我们实现了一种简化的实施方式,称为 “Token-Efficient Leverage Learning (TELL)”。TELL 展示了 Leverage Learning 的潜力,并在各种 LLMs 和低资源任务中展示了有效性,任务数据需求降低了近一个数量级,并且在与传统的监督微调 (SFT) 相比表现出有竞争力的性能。我们讨论了 Leverage Learning 的机制,提出它与量化假设相一致,并通过经验测试探索了它的潜在潜力。