Nov, 2023

是否为?对持续可控激励工程的探索

TL;DRControlPE 是一种对大型语言模型进行微调和精细控制的技术,利用 LoRA 实现连续的 Prompt 引导权重调整,有效地管控生成过程中的 Prompt 影响。通过生成专门的数据集进行 Prompt 精炼,并将其应用于 LoRA 模型,通过调整 LoRA 合并权重来调控 Prompt 的影响,从而实现了动态且可适应的 Prompt 控制。通过实验证明了 ControlPE 在控制各种类型的 Prompt 上的实用性和有效性,包括生成短回答 Prompt、拒绝 Prompt 和思路链 Prompt。