Jan, 2023
语言模型比人类遵循提示时表现更差吗?情况复杂
Are Language Models Worse than Humans at Following Prompts? It's Complicated
Albert Webson, Alyssa Marie Loo, Qinan Yu, Ellie Pavlick
TL;DR该研究发现,人类能够忽略无关信息,并在任务中表现出色。然而,在面对有意误导的指示时,人类表现出忠诚,而模型则不然。因此,未来的研究不应理想化人类行为,而应在实证验证之后再培训或评估模型。