Jun, 2023

基于 xNot360 数据集的 GPT 负面情感检测评估分析

TL;DR本研究评估了 Generative Pre-trained Transformer(GPT)模型,特别是 GPT-2、GPT-3、GPT-3.5 和 GPT-4 的否定检测性能,结论显示这些模型在否定检测中性能差异显著,GPT-4 的性能最优,GPT-3.5 则显示出明显的性能下降,并强调了在医疗、科学、法律等高风险领域合理逻辑的重要性