Apr, 2023
评估ChatGPT的信息提取能力:性能、可解释性、校准度和忠实度评估
Evaluating ChatGPT's Information Extraction Capabilities: An Assessment
of Performance, Explainability, Calibration, and Faithfulness
TL;DR本研究使用7个信息提取任务评估了ChatGPT在理解用户意图和提供合理回答方面的总体能力,发现其在标准信息提取设置中的表现差,但在OpenIE设置中表现出色,并提供高质量和可信任的解释,但存在预测自信度过高导致校准性低的问题。