- 基于马尔可夫序列的缺失质量优化估计
我们研究了离散时间,符合遗传马尔可夫链问题中估计固定质量(也称为 unigram 质量)的问题。我们开发了一种线性运行时间估计器,称为 Windowed Good-Turing(WingIt),并证明它的风险按照混合时间的总变化比例衰减。
- 基于病例对照研究的逻辑回归有效半监督推断
在半监督学习设置下,使用案例 - 对照抽样方法采集到的带有结果和协变量的标记数据集以及仅包含协变量的未标记数据集,可以通过构建观测到的标记和未标记数据的似然函数,并通过迭代算法获得最大似然估计,从而识别出截距参数并同时提高斜率参数的估计效率 - 网络上的相互作用粒子系统:网络和相互作用核的联合推断
在网络上建模多智能体系统是各种学科中的一个基本挑战。我们从由多个轨迹组成的数据中共同推断网络的权重矩阵和相互作用核,分别确定智能体之间的相互作用以及此类相互作用的规则。我们提出的估计器自然导致一个非凸优化问题,我们研究了两种方法来解决:一种 - 基于数据驱动的 Bayes 二元分类器假阳性率估计与软标签
本文提出了一种用于估计贝叶斯分类器中的假阳性率的估计器,并对其进行了广泛的理论分析,包括一致性、无偏性、收敛速度和方差。此外,还通过利用去噪技术和 Nadaraya-Watson 估计器,开发了一种用于估计有噪声标签情况下的假阳性率的有效估 - 最佳 N 对齐策略的理论保证
用一种简单且有效的方法来对齐生成模型是最佳 n 策略,从基本策略中抽取 n 个样本并根据奖励函数进行排名,选择排名最高的样本,本文否定了文献中常用的分析表达式,证明了 KL 散度和最佳 n 策略以及基本策略之间不相等的关系,并探讨了这个上界 - 关于从随机几何图中估算维度的注记
给定以未知密度 f 为基础的 n 个 i.i.d. 随机向量 Xi 产生的随机几何图 Gn,估计其潜在空间的维度 d 的问题。研究发现,在满足条件 n^(3/2) r_n^d→∞和 r_n=o (1) 的情况下,存在一个估计器,其在概率意义 - 平均回报马尔可夫决策过程的最佳样本复杂度
我们在具有均匀遍历的马尔可夫决策过程(MDP)中,通过建立一个估计器来实现平均奖励 MDP 的最优策略,其样本复杂度达到文献中的下界,并借鉴了 Jin 和 Sidford(2021)以及 Li 等人(2020)的算法思想。
- 逆向渲染的联合采样和优化
使用 Monte Carlo 估算的梯度进行优化参数时,通过对每次迭代进行多个梯度样本的平均化可以减少方差。然而,对于需要进行数千次优化迭代的问题,这种方法的计算成本会迅速上升。我们推导了一个理论框架,通过交错采样和优化,更新和重复使用过去 - 多标签噪声转移矩阵估计与标签相关性:理论与算法
本文研究了噪声多标签学习中类相关的转换矩阵的可辨识性,并提出了一种新的估计器,该估计器利用标签相关性而无需锚点或精确拟合噪声类后验概率。通过信息提取纯净标签相关性,并利用这些事件概率暗示的标签相关性的差异,证明了转换矩阵的可辨识性,并通过解 - 基于分布式的离线策略评估:面向推荐系统的多项式建议
提出了一种估计多个物品推荐策略的完整离线性能分布的估计器,并确定了估计器无偏且一致的条件。通过在合成数据和基于真实世界数据(MovieLens-20M)构建的推荐模拟器上进行实证验证,结果表明相比以前的工作,在各种推荐类型的情况下,估计方差 - 从高斯图模型和高斯自由场学习网络
通过基于高斯分布的傅里叶分析属性,我们提出了一个新的估计器,可从在网络上重复测量的高斯自由场图中估计加权网络的结构(等价地,其拉普拉斯矩阵),并展示了具体的恢复保证和所需样本复杂度的界限。
- 部分可观察马尔可夫决策过程中的动态深度强化学习算法
通过将动作序列纳入来解决部分可观察马尔可夫决策过程,本研究提出了几种结构和方法来扩展最新的深度强化学习算法与 LSTM 网络,结果显示这些算法提升了控制器对不同类型外部干扰的鲁棒性。
- 深度神经网络对扰动的敏感性估计器
深度神经网络对扰动的敏感性估计器的推导和测试,以及对两个卷积神经网络进行的随机扰动和对抗攻击的研究。
- 蒙特卡洛模拟和最大最优传输中的政策梯度最优相关搜索用于方差缩减
提出了一种新的算法用于估计方差的减小,其中 X 是某个随机微分方程的解,f 是测试函数。新的估计器是 (f (X^1_T)+f (X^2_T))/2,其中 X^1 和 X^2 的边际法与 X 相同,但路径上具有相关性以减小方差。最优关联函数 - ACL通过 Hawkes 过程建模对话中用户满意度的动态变化
本文提出了一种基于 Hawkes 过程的用户满意度评估器 ASAP,可以更好地模拟对话中用户满意度的动态变化,实验结果表明 ASAP 可以显著优于现有评估器。
- 公平与稳定性:估计方差是朋友还是敌人?
本文讨论了估计器误差分解中的偏差项、方差项和不可避免噪声项, 研究了社会特权和社会劣势群体的公平性问题,并提出了一种基于组间方差的性能度量方法。同时,研发了一个开源库,将不确定性量化技术与公平性分析融合,并在标准基准测试上对基于方差的公平性 - 算法资源分配随机试验的改进策略评估
该研究提出了一种新的评估算法资源分配政策的实验方法,所使用的估计器可以通过重划分试验组参与者,构建对照试验并准确地评估结果。经过实证研究,该方法在合成数据、半合成数据和真实案例中都取得了改进的评估准确性。
- 稀疏概率一致性
本文提出 Sparse Probability of Agreement(SPA)的概念,以估计当没有所有标注 - 项目对可用时的协议概率,并提供多种加权方案处理不同程度标注的数据,其可成为无偏估计器。
- ICML差分隐私极大信息系数
介绍了一种新的统计学方法,MICr 统计量,用于在保持差分隐私的同时近似计算 Maximal Information Coefficient,并证明 MICr 是 MIC 的一致估计器。
- MM深度神经网络在物理层通信中的理论分析
本文研究深度神经网络在物理层通信中的应用,首先通过比较传统和基于 DNN 的编码器的性能来验证其可行性,接着通过理论分析 DNN 估计器的性能来展示其吸引人的特点,并探究 DNN 通信系统中的信息流动机制以及与传统的通信系统的差异。该研究为