BriefGPT.xyz
Ask
alpha
关键词
priority rule following
搜索结果 - 1
SoFA: 通过优先规则遵循进行实时隐蔽对齐
该论文引入了一种新的对齐范式,即优先规则遵循,通过将规则定义为每个对话中的主要控制机制,并将其置于用户指令之上,来解决大语言模型(LLMs)中的对齐问题。作者提出了 PriorityDistill 方法,通过从 LLM 模拟中提取优先遵循信
→
PDF
5 months ago
Prev
Next