Jan, 2023

语言模型比人类遵循提示时表现更差吗?情况复杂

TL;DR该研究发现,人类能够忽略无关信息,并在任务中表现出色。然而,在面对有意误导的指示时,人类表现出忠诚,而模型则不然。因此,未来的研究不应理想化人类行为,而应在实证验证之后再培训或评估模型。