May, 2023

CGCE: 一个用于普及和金融领域的中文生成式聊天评估基准

TL;DR引入中文生成式聊天评估基准(CGCE)基准,旨在评估和比较生成模型。该基准由200个一般领域问题和150个专业财务领域问题组成,可评估精确性、条理性、表达清晰度和完成度等因素,为研究人员提供标准框架,促进自然语言生成研究的发展。