Mar, 2024

MATEval:用于推进开放式文本评估的多智能体讨论框架

TL;DR通过 MATEval 框架使用生成型大型语言模型进行多智能体文本评估,针对评估开放性文本中的不确定性和不稳定性问题进行改进,并取得了与人类评估最高的相关性,大幅提高了工业场景中的文本评估和模型迭代效率。