Apr, 2023

评估ChatGPT的信息提取能力:性能、可解释性、校准度和忠实度评估

TL;DR本研究使用7个信息提取任务评估了ChatGPT在理解用户意图和提供合理回答方面的总体能力,发现其在标准信息提取设置中的表现差,但在OpenIE设置中表现出色,并提供高质量和可信任的解释,但存在预测自信度过高导致校准性低的问题。