BriefGPT.xyz
May, 2023
CGCE: 一个用于普及和金融领域的中文生成式聊天评估基准
CGCE: A Chinese Generative Chat Evaluation Benchmark for General and Financial Domains
HTML
PDF
Xuanyu Zhang, Bingbing Li, Qing Yang
TL;DR
引入中文生成式聊天评估基准(CGCE)基准,旨在评估和比较生成模型。该基准由200个一般领域问题和150个专业财务领域问题组成,可评估精确性、条理性、表达清晰度和完成度等因素,为研究人员提供标准框架,促进自然语言生成研究的发展。
Abstract
generative chat models
, such as
chatgpt
and
gpt-4
, have revolutionized natural language generation (NLG) by incorporating instructions and
→