EMNLPNov, 2022

难例也更难解释吗?人类和模型生成的解释研究

TL;DR通过人类编写的常识规则与 GPT-3 生成的描述进行比较,本研究研究了 LLM、人类在简单与困难例子的数据标注解释方面的能力,研究结果表明对于简单示例,GPT-3 生成的解释具有高度的支持性,而人类解释更具有通用性,对于困难示例,人类解释在标签支持和通用判断方面都比 GPT-3 解释更好。