BriefGPT.xyz
大模型
Ask
alpha
关键词
emulated fine-tuning
搜索结果 - 1
使用小型语言模型来微调大型语言模型的仿真器
通过借鉴 RL 的框架,引入了一种名为模拟微调(EFT)的技术,从而将预训练和微调的知识与技能解耦,并且通过扩大微调的规模来提高可帮助性,扩大预训练的规模来提高事实性,从而实现在测试时调整不同行为特征的方法,而无需额外训练。
PDF
8 months ago
Prev
Next