BriefGPT.xyz
Ask
alpha
关键词
alignment technologies
搜索结果 - 3
我们离 AGI 还有多远
人工智能的发展深刻影响了人类社会,并在多个领域取得了重大进展。然而,对人工智能的不断需求突显了其现有能力的局限性,推动了向人工通用智能(AGI)的发展。AGI 以其与人类智能相当的效率和有效性,具备执行多样化现实任务的能力,代表着人工智能演
→
PDF
2 months ago
关于本质和前景的研究:大型模型的对齐方法调查
大型模型在人工智能领域取得了革命性突破,但也可能引发一些潜在的担忧。本文综合研究价值对齐方法,探究了历史背景、数学本质以及现有对齐方法(强化学习、监督微调和上下文学习)的联系、优势和局限,并讨论了个性对齐和多模态对齐作为该领域的新兴方向。最
→
PDF
4 months ago
消除否定性:通过分布偏好优化实现无需人工正例样本的对齐
通过利用人工标注的负样本,提出了一种基于分布差异优化的方法来使大型语言模型朝向人类偏好对齐,以减少有害信息的生成。实验证明该方法在生成质量、有害信息数量和训练稳定性方面均优于最新基线模型。
PDF
4 months ago
Prev
Next