BriefGPT.xyz
Ask
alpha
关键词
alignment issues
搜索结果 - 2
委派博弈中的合作与控制
本文中,我们正式分析了代理人协作中的控制问题、合作问题、对齐问题和能力问题,以及这些问题对委托人利益的影响,并展示了如何通过有限观察来估计这些指标,并为设计更协调和合作的 AI 系统提供帮助。
PDF
5 months ago
大型语言模型作为双人游戏中的代理
通过在单一统一的机器学习范式中正式定义大型语言模型(LLM)的训练过程,包括预训练、监督微调和强化学习与人类反馈,我们可以获得推进 LLM 技术的重要见解。本文勾勒出 LLM 训练方法与两人博弈中代理人发展所采用的战略之间的相似之处,从博弈
→
PDF
5 months ago
Prev
Next