Jan, 2024

超越行为主义的表征伤害:测量与缓减计划

TL;DR该研究旨在扩大对可代表性危害的定义,通过量化和减轻大型语言模型对认知和情感状态造成的损害,建立一个公平研究的实用度量和减轻的框架。