BriefGPT.xyz
大模型
Ask
alpha
关键词
behavioral alignment
搜索结果 - 2
基于浅层未训练多头注意力网络的类脑语言处理
通过研究大型语言模型,该论文揭示了语言模型与人类大脑的相似性,重点分析了架构组件中的分词策略和多头注意力以及需求确定性的关键因素,最终提出了一种高度与人类大脑和行为对齐的模型。
PDF
11 days ago
ICLR
通过合成数据对 LMLs 进行行为对齐的优化提炼直接偏好优化
提出一种称为 “rDPO” 的方法,通过自我批评引导创建合成数据,并利用广义的 DPO 损失函数蒸馏为学生 LLM,其中使用额外的外部奖励模型提高合成数据质量,从而改善大型语言模型的行为对齐。
PDF
5 months ago
Prev
Next