Jun, 2024

文化影响还是安慰剂?关于社会人口统计提示的有效性

TL;DR系统研究了四种 LLMs 随不同类型提示文本在不同类型数据集上的回应变化,对于文化条件提示作为检验模型文化偏见或对齐策略的方法的鲁棒性提出了疑问,同时呼吁重新思考控制实验设计以区分回应的文化条件与 ' 安慰剂效应 ' 之间的关系。