Apr, 2023
评估 ChatGPT 的信息提取能力:性能、可解释性、校准度和忠实度评估
Evaluating ChatGPT's Information Extraction Capabilities: An Assessment of Performance, Explainability, Calibration, and Faithfulness
Bo Li, Gexiang Fang, Yang Yang, Quansen Wang, Wei Ye...
TL;DR本研究使用 7 个信息提取任务评估了 ChatGPT 在理解用户意图和提供合理回答方面的总体能力,发现其在标准信息提取设置中的表现差,但在 OpenIE 设置中表现出色,并提供高质量和可信任的解释,但存在预测自信度过高导致校准性低的问题。