Jul, 2024

自引导:通过自合成微调实现更好的任务特定指示跟随

TL;DRSELF-GUIDE机制通过自我合成的数据,指导大型语言模型(LLM)在特定任务上进行微调,显著提高性能,为LLM赋予任务特定的专家能力,无需外部学习信号。