Nov, 2023

评估使用自我报告的 AI 系统道德地位的研究

TL;DR通过自描述提供研究 AI 系统是否具有道德意义的内在状态,讨论了自描述在当前系统和人类中的适用性,并提出了培训模型回答关于自身的问题以实现内省式能力的方法,同时探讨了评估这些技术成功程度的方法和相关挑战。