- 鉴别性总变差距离估计:生成数据的保真度稽核器
本文基于判别性方法提出了一种评估生成数据保真度的方法,利用总变差距离作为有效的度量。通过定量地表征两个分布分类的贝叶斯风险和它们的总变差距离的关系,实现了总变差距离的估计。特别地,本文建立了关于两个高斯分布总变差距离估计误差收敛速率的理论结 - 半监督学习在不确定标签情况下的渐近贝叶斯风险
在高斯混合模型上考虑半监督分类设置,其中数据并不像通常那样严格标记,而是具有不确定的标签。我们的主要目标是计算该模型的贝叶斯风险,并对该模型的贝叶斯风险和已知的最佳算法进行比较。这种比较最终提供了对算法的新见解。
- MM深度多智能体强化学习在去中心化主动假设测试中的应用
我们提出了一种基于深度多智能体强化学习框架的算法,名为 MARLA,用于多智能体主动假设检验问题,通过将每个智能体的状态映射到行动,从而最小化贝叶斯风险。我们通过实验结果有效展示了智能体学习协作策略和通过 MARLA 提升性能的能力,并展示 - 学习在噪声干扰下的一般性框架:标签干扰、属性干扰及其它
本文通过马尔科夫核心框架对数据集水平下的数据污染模式进行了形式化分析,展示了标签和属性上存在复杂数据污染的影响,同时通过分析 Bayes 风险的变化,论述了这些污染对于标准监督学习的影响,为今后的定量比较提供了基础。
- 学习具有先验信息的基本权衡
本文探讨学习者对问题的先验信息的准确性与其学习表现之间的基本平衡问题,介绍了优先风险的概念,提出了一种推广最小化上限技术的方法来限制统计估计问题的优先风险,同时为了限制更一般的损失而引入了 Fano's inequality 的新概念,展示 - 代码生成的编码器评审重新排名
通过添加 Reviewer 模型来限制生成代码的多样性并对生成结果进行评估,从而改善了常见的代码生成算法中对退化方案的倾向,实验结果表明,这种算法实现简单且泛化性强,有望在某些情况下取代最小贝叶斯风险方法。
- 提前停止的神经网络具有一致性
研究使用逻辑损失的梯度下降训练 ReLU 网络在二元分类数据上的行为,证明通过提前停止的梯度下降可以在总体风险上接近最优,并获得概率校准。
- 关于均场极限下两层 ReLU 网络梯度下降训练的收敛性
在均场模型下,用梯度下降训练双层 ReLU 网络时,我们描述了最小贝叶斯风险收敛的必要和充分条件。该条件不依赖于参数的初始化,只涉及神经网络实现的弱收敛,而不是其参数分布。
- ICML连续时间事件流中的丢失事件插补
本文提出了一种基于粒子平滑的方法,通过使用一种基于双向连续时间(LSTM)的可训练提议分布来填补残缺的序列,从而推断出遗漏的事件序列,该方法在多个合成和真实领域实验中表现出色,在推断地面真实未观察到的事件方面十分有效。
- F-BLEAU:快速黑盒泄露估计
本文研究了在黑盒条件下测量系统对其秘密输入的泄露量问题,提出了使用 ML 方法来估计系统的贝叶斯风险,并展示了最近邻规则的应用,以降低黑盒查询的数量,并处理连续输出的系统。
- 关于分散估计中贝叶斯风险的信息论下限
本文针对分布式估计中存在通信约束的情况,使用信息理论等量化方法来推导出下边界,进而量化资源分配给多个处理器造成的估计性能下降。
- 度量的普适性、特征核和 RKHS 嵌入
本文研究了有限符号 Borel 度量空间的 Hilbert 空间嵌入及其特性,揭示了通用核与特征核之间的关系,并给出了一个新的通用核特征定义。
- 线性参数化赌博机
本文研究基于多维随机向量臂收益的赌博机问题,证明了在解决特定问题时使用相应的相位策略可以达到最优的累计遗憾和贝叶斯风险,并提出了针对通用问题的近似最优解。
- 低噪声假设下分类聚合的最优速率
采用指数权重的综合方法,在边际假设下,对于铰链风险(hinge risk),获得了凸聚合的最优速率。 此外,在边际假设下,对于超额贝叶斯风险,获得了模型选择聚合的最优速率。