Mar, 2023

用人类反馈的强化学习的社会影响视角

TL;DR本文系统地研究了 RLHF 的社会影响,提出了七种 RLHF 的应用方式,分析了其对人类体验 AI 的积极影响,同时也探讨了 RLHF 可能带来的社会道德问题,以及其与人类相互作用的方面。因为 RLHF 引发的关注类似于现有 AI 技术引发的关注,因此需要对 RLHF 的采用进行审慎且有意识的考虑。