关键词certification framework
搜索结果 - 5
- 正式验证的近似模型计数
我们提出了第一个近似模型计数的认证框架,并且证明了其输出近似值的质量保证。
- 大型语言模型中的偏差定量认证
大型语言模型(LLMs)可以产生展现社交偏见并支持刻板印象的回答。然而,传统的基准测试无法充分评估 LLM 偏见,因为它无法扩展到大量的提示集,并且没有提供保证。因此,我们提出了一种新的认证框架 QuaCer-B(Bias 的定量认证),它 - QuaCer-C: LLM 中知识理解的定量认证
提出了一种新的 QuaCer-C 证明框架来正式认证流行的 LLMs 的知识理解能力,通过高置信度的概率上界,证明 LLMs 在任何相关知识理解提示上给出正确答案的能力与参数数量的增加而提高,Mistral 模型在这个评估中表现不佳。
- ICLRCOPA: 离线增强学习中针对污染攻击进行认证鲁棒策略
本文介绍了针对强化学习在训练过程中的恶意攻击问题,提出了首个基于合规框架 COPA 的认证方案,证明了该方案在不同的认证标准下的有效性,同时通过在三种不同算法训练的 RL 环境上实验,发现不同算法和环境的鲁棒性存在差异。
- ICML黑盒函数的域外泛化认证
本研究提出了一种基于 Hellinger 距离的证明技术,可以用于证明黑盒模型和有界损失函数的分布健壮性和域外泛化。实验证明这种技术在大型神经网络和不同类型的损失函数下具有良好的可扩展性和灵活性。