- 基于变形器的学习可证明具有低秩和稀疏性:一层分析
这篇论文首次从理论上分析了低秩和稀疏性在一层 Transformer 中的特性,并通过数量化可训练参数的梯度更新得出了梯度具有低秩性的结论,同时论文还分析了模型剪枝对泛化能力的影响以及对计算效率的改善。
- 用预测的难样本标签重新训练可证明提高模型准确性
通过理论分析,在给定随机受损标签的线性可分情境中,重新训练可以提高模型的整体准确率,并且通过基于共识的重新训练方法在没有额外的隐私成本的情况下显著提高标签差分隐私训练的准确率。
- 利用向量逼近提高标签差分隐私的学习
我们提出了一种向量逼近方法,将每个标签转换成具有 K 个分量的随机向量,其期望值反映类别条件概率,该方法在理论上只略微下降,并通过实验证实了我们的理论分析和方法的实际性能。
- 缩小差距:在具有神经网络参数化的马尔可夫抽样下实现演员 - 评论员的全球收敛(最新迭代)
该研究论文通过对 Actor-Critic 算法进行全面的理论分析,包括五个实践方面(即 MMCLG 标准),从而建立了全局收敛的样本复杂度界限,为实践应用提供了理论依据。
- 探索自监督图像去噪与变性
本文通过理论分析和数值实验深入分析了使用变性数据的自监督降噪算法,讨论了该算法在优化问题的种群风险上找到期望解的同时,经验风险的保证则取决于变性水平对降噪任务的难度。实验结果表明,使用变性图像进行训练的算法起作用,并且经验性能与理论结果相一 - 基于边缘差异的域间文本分类对抗训练
多领域文本分类(MDTC)是利用相关领域的可用资源来提高目标领域的分类准确性。本研究提供了关于 MDTC 的理论分析,将其分解为多个领域适应任务,并以边缘差异作为领域差异的度量,建立了一个基于 Rademacher 复杂度的新的泛化界限,并 - 从人类反馈中进行吉布斯采样:基于可证明的 KL 约束的 RLHF 框架
研究生成模型与强化学习从人类反馈中的对齐过程的理论框架,考虑了逆 KL 正则化情境赌博机在此方面的应用,通过离线和在线设置的理论属性研究以及与现有实际对齐算法的联系,为未来算法设计提供新的工具和见解。
- 关于具有 $ε$- 贪心探索的 Deep Q-Networks 的收敛性和样本复杂度分析
该论文通过理论分析探讨了深度强化学习中的深度 Q 网络(DQN)和 ε- 贪心探索。论文提供了对实际情况下采用 ε- 贪心策略的 DQN 的首个理论收敛性和样本复杂度分析,并证明了带有递减 ε 的迭代过程能够几何收敛到最优 Q 值函数。实验 - 神经网络通过梯度特征学习的可证实保证
神经网络理论分析不足,该研究提出了一个基于梯度的特征学习分析框架,应用于混合高斯函数和奇偶函数等问题,并揭示了网络学习现象与特征学习的关系。
- 采样、优化和提升的广义伊藤链的伊藤扩散逼近
这项工作考虑了一类非常普遍而广泛的 Markov 链,即类似于某些随机微分方程的 Euler-Maryama 离散化的 Ito 链。我们研究的链是一个统一的理论分析框架,与大多数相关论文中的正常和状态独立的噪声不同,它具有几乎任意的各向同性 - 多载波多天线系统的直视通道绘图优化
在本文中,对相位失敏距离进行了彻底的理论分析,并探讨了其局限性,为设计能够学习质量图表的系统提供了指导。随后,对不同场景下的合成和真实数据进行了实验验证。
- ICML隐式神经网络与显式神经网络的等效性:一个高维视角
高维隐式神经网络的理论分析与显式网络之间的联系和差异,构建了对应共轭核和神经切向核的高维等价关系,从而在高维空间中建立了隐式与显式网络之间的等价性。
- KDD图神经臂带
通过图神经网络,本论文提出了一种名为图神经赌博(GNB)的框架,旨在利用用户之间的协作特性来提高在线推荐系统的性能,并通过理论分析和实证研究验证了我们提出的框架的有效性。
- ICML反事实不变性的结果
本文从理论角度分析了反事实不变性的各种定义及其相关性,包括条件独立性是否能证明其强弱程度和可能性。 针对离散因果模型,我们证明了反事实不变函数通常只能是特定变量的函数,甚至是常数。
- 利用多实例弱监督学习潜在模型
本文针对监督信号由多输入实例上的标签的转移函数 σ 生成的弱监督学习方案,提出了多实例偏标签学习(multi-instance PLL)问题,并给出了对于可能的未知转移 σ 的第一理论分析。通过使用一种在神经符号学中广泛使用的顶部 - k - ICML神经属性融合的低计数张量完成
本研究通过低秩泊松张量模型和神经网络学习算法,在理论上支持了未完全统计的多方面数据完成,提出了可以证明从部分观测中恢复张量的完全统计条目及其每个条目的欠计数概率的 UC-TC 公式,并进行了模拟和实际数据实验。
- ICML学习集成策略的理论保证及其在时间序列预测中的应用
使用理论分析方法,我们证明了从有限或有限维族中选择最佳堆叠综合的交叉验证方法不会比最佳方案表现差得多,进一步提出了一种特定的堆叠综合族在概率预测中的应用,并通过实验结果证明了所提出方法的性能提高。
- 最短编辑路径交叉:演化神经结构搜索中置换问题的理论驱动解决方案
本论文提出了一种新的基于最短编辑路径的交叉操作符,该操作符在图结构上克服了排列问题,并在黑盒神经架构搜索中实现了比变异、标准交叉和强化学习更好的预期进展,因此允许充分利用种群搜索。新的交叉操作符可以作为黑盒神经架构搜索方法的基础理论。
- 带缓冲异步聚合的联邦学习中的无限梯度
本文通过移除梯度范数有界的假设,对异步联邦学习算法 FedBuff 进行了理论分析,研究了数据异构性、批次大小和延迟等因素对算法收敛速度的影响,从而提高跨设备联邦学习的可扩展性。
- 测试二元预测的评分规则
该论文构建了一个专家预测模型,研究表明适当的计分规则可以激励专家利用他们的预测来操纵世界,并提出了一类避免这一问题的简单计分规则。