May, 2024

评估和验证 LLM 驱动的应用中的任务效用

TL;DR通过提出一套针对特定应用目的的标准,AgentEval 框架可以自动化地简化应用的效用验证过程,从而综合评估和量化该应用程序的效用。