BriefGPT.xyz
大模型
Ask
alpha
关键词
llm-powered applications
搜索结果 - 3
评估和验证 LLM 驱动的应用中的任务效用
通过提出一套针对特定应用目的的标准,AgentEval 框架可以自动化地简化应用的效用验证过程,从而综合评估和量化该应用程序的效用。
PDF
2 months ago
LLM 技术应用中的人类不可感知检索污染攻击
LLM 应用开发、检索增强生成、LLM 应用、检索污染以及风险评估是本文的关键词。作者揭示了一种称为检索污染的新威胁,攻击者可以通过欺骗 LLM 应用程序在检索生成过程中生成恶意回应,对应用程序进行破坏。通过分析 LLM 应用程序框架,攻击
→
PDF
2 months ago
迈向更好的人机协作:评估 LLM 驱动应用中的任务效用
介绍了一种新的框架 AgentEval,用于验证大型语言模型(LLM)驱动应用程序的实用性,并提供一套与特定应用程序目标相符的评估标准,以全面评估其实用性。
PDF
5 months ago
Prev
Next