Feb, 2024

AuditLLM: 使用多探针方法审计大型语言模型的工具

TL;DR通过批量分析来自一个问题的多个探针生成的回答,AuditLLM 能够测试给定的 LLM 以评估其性能,并得出对 LLM 的一致性的易于解释的结果。它可通过实时查询分析响应进行即时审核,也可通过处理多个查询进行综合分析,旨在提供一个标准化的审核平台,以增进对 LLM 生成回答的能力的理解。