Nov, 2023

是否为?对持续可控激励工程的探索

TL;DRControlPE是一种对大型语言模型进行微调和精细控制的技术,利用LoRA实现连续的Prompt引导权重调整,有效地管控生成过程中的Prompt影响。通过生成专门的数据集进行Prompt精炼,并将其应用于LoRA模型,通过调整LoRA合并权重来调控Prompt的影响,从而实现了动态且可适应的Prompt控制。通过实验证明了ControlPE在控制各种类型的Prompt上的实用性和有效性,包括生成短回答Prompt、拒绝Prompt和思路链Prompt。