- 有效的 PAC 学习与回应是 "是" 或者 "否" 的 Oracle 可能吗?
在本文中,我们探讨了在二分类的 PAC 学习中,是否有比经验风险最小化(ERM)更弱的预测力量仍然能够实现学习,结果表明只需多项式代价就可以使用我们的更弱预测力量来学习概念类,同时也满足了 Alon 等人提出的对于有效性学习的算法原则的要求 - 多目标线性收缩协方差估计的分析
多目标线性收缩是标准单目标线性收缩在协方差估计中的扩展,通过将几个常数矩阵(目标)与样本协方差矩阵相结合,推导出具有精确和经验均值的正式多目标线性收缩估计器,并在 Kolmogorov 渐近性下证明了其收敛性。最后,我们通过实验证明,在各种 - 具有熵正则化的独立自然策略梯度在游戏中的线性收敛
这项研究主要关注多智能体强化学习中的熵正则化独立自然策略梯度算法,通过引入熵正则化实现有界理性的决策,从而使智能体的行为接近纳什均衡,并通过实证结果验证了理论分析的可靠性。
- ORacle:大规模视觉语言模型用于知识引导的整体领域建模
ORacle 是一种先进的视觉语言模型,用于整体手术室领域建模,通过多视图和时序能力,结合外部知识进行推理,适应以前未见过的外科手术场景,并展示了提高手术室领域建模可扩展性和可负担性的潜力。
- 随机双层优化中一阶方法的复杂度研究
通过使用 y^*-aware oracle,我们提出了一种简单的一阶方法,它可以使用 O (ε^{-6}),O (ε^{-4}) 的一阶 y^*-aware oracles 来收敛到一个 ε 稳定点。
- AAAI用于近似模型计数的可审计算法
模型计数、近似计数算法、可审核的近似计数器、证书和 oracle
- 通过自然语言指导的语义探索提高深度强化学习的效率
用检索式方法通过神经网络编码,选择性、高效地与 oracle 进行交互,并使用 oracle 的答案更新 agent 的策略和值函数,从而在强化学习任务中大幅提高效率。
- 基于基础模型的鲁棒性:利用预训练模型进行鲁棒图像模型评估
机器学习中引入了一种新的鲁棒性测量方法,通过与基准模型相比较直接评估图像分类模型的表现;此方法使用新样本扩展图像数据集以评估模型的鲁棒性性能,并揭示模型行为和评估策略。
- 负面情绪不要如此消极!具有指导助手的基于评分的生成建模
基于最大似然原则的参数估计,使用迭代最优化算法获取数据似然函数的最优解。本文提出一种新的去噪扩散概率模型方法(Gen-neG),利用外部的辅助信息进行模型学习,在生成过程中通过生成对抗网络(GANs)和鉴别器引导策略,将生成样本限制在正区域 - 连续武装赌博机:函数空间视角
该论文研究了在更一般的平滑条件下使用 continuum-armed 摇臂赌博机优化未知的目标函数,包括优化 Lipschitz 连续的目标函数和具有 Besov 平滑性的目标函数,并在简单和累积后悔下导出了最小的极小值率。
- 使用球优化 Oracle 进行加速
使用 oracle 和 Newton 方法来设计加速算法以达到更优秀的拟合结果。
- ORACLE: 基于卷积神经网络的优化无线电分类
ORACLE 是一种检测来自大量相似设备的独特无线电信号的方法,它利用卷积神经网络(CNN),能够平衡计算时间和准确性,而且只需物理层的 IQ 样本来训练。它通过软件指令有意引入控制性的不完美之处,以提高 CNN 的分类器的可区分度,而且呈 - 带噪声查询的聚类
本文研究了带有噪声查询的聚类问题,提供了信息理论下限以及与之匹配的新算法,并介绍了在众包、社交网络和随机块模型中应用的情况。
- NIPS开放世界中的未知未知的辨识:引导探索的表征和策略
本文提出了一个模型无关方法,该方法使用来自一个 oracle 的反馈来识别和智能引导 unknown unknowns 的发现,我们采用两阶段方法,我们首先根据实例特征的相似性和预测模型分配的置信度将数据组织成多个分区,然后利用探索 - 开 - ACL反思神谕:经典博弈论的基础
该论文提出一种 “反思性” Oracle 的类型,该类型可用于定义使用因果决策理论的理性代理。 这可以被视为为经典博弈论提供基础,其中玩家不是特殊的,并且它们相互作用将发挥纳什均衡。