Mar, 2023

用人类反馈的强化学习的社会影响视角

TL;DR本文系统地研究了RLHF的社会影响,提出了七种RLHF的应用方式,分析了其对人类体验AI的积极影响,同时也探讨了RLHF可能带来的社会道德问题,以及其与人类相互作用的方面。因为RLHF引发的关注类似于现有AI技术引发的关注,因此需要对RLHF的采用进行审慎且有意识的考虑。