BriefGPT.xyz
Ask
alpha
关键词
learning with expert advice
搜索结果 - 3
从外部到 Swap Regret 2.0:大动作空间的高效减少和无视敌对
我们提供了一种新颖的从交换后悔最小化到外部后悔最小化的约简方法,该方法改进了 Blum-Mansour 和 Stolz-Lugosi 的经典约简,不需要动作空间的有限性。我们的结果表明,只要存在某个假设类的无外部后悔算法,同样必然存在该类别
→
PDF
8 months ago
用乘法重新加权进行神经网络鲁棒性优化
提出一种使用 MW 重新加权示例的神经网络优化方法,该方法在标签存在噪声的情况下稳健且可提高准确性,同时不会影响其对抗鲁棒性。
PDF
3 years ago
加密币赌注与无需参数的在线学习
该研究在 Hilbert 空间中,通过预测对手行为的赌博机制构建了一种简单的无需调参数的学习算法,用于在线线性现行优化和专家建议学习,实现了优质的后悔约束和分析复杂度。
PDF
8 years ago
Prev
Next