Mar, 2023

GPTEval:利用 GPT-4 进行更有效的人工智能对齐的自然语言生成评估

TL;DR使用大型语言模型和一种具有连续思考特点的填充范式,提出了一种 NLG 质量评估框架,结合两种生成任务 —— 文本摘要和对话生成,使用 GPT-4 模型作为骨干模型,与以往方法相比性能更好。