Apr, 2023

评估 ChatGPT 的信息提取能力:性能、可解释性、校准度和忠实度评估

TL;DR本研究使用 7 个信息提取任务评估了 ChatGPT 在理解用户意图和提供合理回答方面的总体能力,发现其在标准信息提取设置中的表现差,但在 OpenIE 设置中表现出色,并提供高质量和可信任的解释,但存在预测自信度过高导致校准性低的问题。