Apr, 2023

ChatGPT 句子级关系评估:重点关注时间、因果和语篇关系

TL;DR该研究针对 ChatGPT 大型语言模型,通过对 13 个数据集的测试集进行综合评估,采用了三种任务定制型 prompt 模板,发现 ChatGPT 对于识别因果关系具有较强的能力,但在识别事件之间的时间顺序方面表现较差,并在需要结构性理解对话的对话语篇分析任务中表现不佳。