BriefGPT.xyz
大模型
Ask
alpha
关键词
delta debugging
搜索结果 - 1
鲁棒即插即用适应性的解耦对齐
我们介绍了一种低资源安全增强方法,用于对齐大型语言模型(LLMs),无需受过监督的精调或来自人类反馈的强化学习。我们的主要思想是利用知识蒸馏从现有的良好对齐的 LLMs 中提取对齐信息,并以即插即用的方式整合到未对齐的 LLMs 中。通过使
→
PDF
a month ago
Prev
Next