BriefGPT.xyz
大模型
Ask
alpha
关键词
specialists
搜索结果 - 3
基于专家建议的留投区随机选择问题
我们研究了专家意见下具有预测的经典问题,假设学习者选择不参与游戏的行动在每次试验中既没有奖励也没有损失,我们提出了 CBA 算法,利用这个假设获得了可以显著改善经典 Exp4 算法的奖励界限。我们将问题视为对置信度评估预测器进行合并,当学习
→
PDF
4 months ago
公平度指标:比较分析
该研究利用一个数学框架描述了公平性评估中一些常用的指标,探讨了它们之间的关系,为算法开发者和用户提供指导。
PDF
4 years ago
ICLR
通过专家集成的方法实现在对抗样本下的鲁棒性
通过使用多个专家的集合,其中专业按混淆矩阵定义,我们发现在存在对抗实例的情况下,专家集合能更好地识别和拒绝愚弄实例,通过拒绝机制使系统更加鲁棒,而不是试图以任何代价正确地对抗其进行分类。
PDF
7 years ago
Prev
Next