BriefGPT.xyz
大模型
Ask
alpha
关键词
task execution efficiency
搜索结果 - 1
迈向更好的人机协作:评估 LLM 驱动应用中的任务效用
介绍了一种新的框架 AgentEval,用于验证大型语言模型(LLM)驱动应用程序的实用性,并提供一套与特定应用程序目标相符的评估标准,以全面评估其实用性。
PDF
5 months ago
Prev
Next