BriefGPT.xyz
大模型
Ask
alpha
关键词
ensemble evaluation
搜索结果 - 2
抑制拒绝:通过破解抑制性拒绝来破解 LLM
利用 DSN 攻击对大型语言模型进行评估,通过集成评估方法有效地解决了常规评估方法中存在的限制问题。
PDF
2 months ago
AAAI
大型语言模型作为自动对话评估器的有效性综合分析
自动对话评估的研究中,大型语言模型、神经度量指标以及元评估数据集的应用,以及模型层次和维度层次的集成对评估性能的影响进行了全面的研究。
PDF
6 months ago
Prev
Next