- AutoOPE:自动离策择估计器选择
自动数据驱动的离策评估估计器选择方法,基于机器学习模型在合成任务中预测最佳估计器,能够在多个真实世界数据集上选择更好的估计器并显著降低计算成本。
- 正交因果校准
本文提供了一个通用框架,用于校准涉及干扰估计的预测器,并使用所谓的 Neyman 正交概念证明了对于任意损失函数,任何因果参数估计的校准误差上界,进而分析了两种样本分割算法在因果校准中的收敛性。
- 在光滑条件下估计一个函数及其导数
从一个嘈杂的数据集中估计未知函数 f * 及其偏导数,对两种估计器进行了证明、一致性研究及收敛速率分析,并在对股票期权和其二阶导数估计为基础股票价格函数的情况下进行了数值验证。
- 平衡短期和长期回报的政策学习
提出了一种新的框架,用于学习有效平衡长期和短期回报的最优策略,通过推导估计器的一致性、渐近正态性和半参数效率界限,揭示了短期结果如若关联,将有助于改善长期回报的估计器,基于所提出的估计器,发展了一种基于原则的策略学习方法,并推导出与所学策略 - 人类反馈的最佳设计
从人类反馈中学习偏好模型一直是人工智能领域最近进展的核心。本研究通过推广最优设计的概念,研究了用于学习偏好模型的数据收集问题,并提出了面向排名列表的有效算法,证明了模型估计器随更多数据而改善,估计器下的排名误差也随之减少,并在多个合成和真实 - 神经麦克林 - 瓦萨夫过程:扩散过程中的分布依赖
将分布依赖显式地包含在随机微分方程的参数化中对于建模具有交互性的时间数据是有效的,并在维持标准 Itô-SDE 的优越性能的同时,通过 MV-SDE 关联的更丰富的概率流类来进行时间数据的建模。
- 概率密度函数的中心度估计器
该研究报告探讨了数据选择问题,旨在构建一族最大化中心性的估计器。这个估计器家族具有一些我们定义的准则下的准确和稳健的概率密度函数拟合性质。我们建立了中心性估计器与最大似然之间的联系,说明了后者是其中的一个特例。因此,提供了费舍尔最大似然的一 - 用于标签稀缺个体提升建模的两个提升估计器的图神经网络
使用基于图神经网络的框架,利用社交网络中的邻居特征和社交关系对提升效果进行建模,解决了现有提升建模方法中面临的信息不足、标记数据稀缺等挑战,取得了在公共数据集和工业数据集上优于最先进方法的卓越性能,已在实际应用中用于提供实时提升效果估计。
- 看到的信息决定了未看到的信息的数量
基于训练数据中出现次数相同的类别数量,研究表明预期情况下,一个未知总体中不出现在训练数据中的类别的数据点比例几乎完全由训练数据中出现的类别数量决定。通过优化和遗传算法,发现估计器的均方误差(MSE)较传统的 Good-Turing 估计器要 - 一致长期预测人人可达动力系统
在一个随机性质的遗传动力学系统下,我们研究分布的演化。通过利用 Koopman 和转移算子理论,可以将任意初始状态的分布向前演化到未来,我们研究了这些算子估计的长期预测表现。在观察到标准的估计方法在这方面可能会失败后,我们提出了一种学习范式 - 固定效应下的静态面板模型的双机器学习
我们开发了从面板数据中估计政策干预措施的估计量,允许混淆回归因子的非线性效果,并使用三个著名的机器学习算法(LASSO、分类和回归树以及随机森林)来研究这些估计量的性能。
- 现实世界中无线电图估计:实证验证与分析
通过使用无人机收集大量数据,并对现有的射频地图估计器进行评估,本研究揭示出具有深度神经网络 (DNNs) 的复杂估计器表现最佳,但需要大量训练数据才能相对传统方案提供实质性优势,同时还提出了一种混合两种类型估计器的新算法,展示了进一步探索该 - ICCV估计器遇上平衡视角:用于训练二值神经网络的修正直通估计器
通过平衡估计误差和梯度稳定性,我们提出了修正的直通估计器(ReSTE),用于神经网络压缩,其比其他估计器更合理且能灵活地平衡估计误差和梯度稳定性。实验结果表明,ReSTE 在 CIFAR-10 和 ImageNet 数据集上表现出色,超越了 - 超越常规:互信息估计评估
本文构建了一个多样的分布族,展示了语言无关基准平台用于互信息估计器的实用性和局限性,并提出了适应问题困难度的适当估计器的选择指南及应用估计器时需要考虑的问题。
- 固定维度下核函数和神经网络的良性过拟合
本研究发现,神经网络的光滑度才是决定良性过拟合的关键,只有在评估器的导数充分大时才能实现良性过拟合。我们证明在固定维度中,光滑度适中的良性过拟合是不可能的,在回归模型中,采用一系列具有大导数的峰形平滑内核可以实现良性过拟合。通过添加小的高频 - 因果位置 - 尺度噪音模型的可识别性和估计
研究了一类称为 location-scale 或 heteroscedastic 噪声模型(LSNM)的模型,提出了两种估计器,并通过 probabilistic 神经网络计算了条件分布的函数,从而证明了在某些病理情况下,因果关系可确定。
- 马尔科夫决策过程中的离线风险评估
本研究探讨了在强化学习中应用基于模型的方法改进 off-policy risk 的估计,构建了第一个适用于 MDPs 的双重稳健估计器,提高了估计精度并实现了 Cramer-Rao 方差下界。
- NIPS生物医学中的标签稀缺问题:数据丰富的潜在因子发现提升表型预测
从英国生物库人群数据集中派生低维嵌入空间可用于改善具有可观数据稀缺性的特定疾病的监督估计器,这会对各种医学数据科学应用程序产生重要影响。
- EMNLP条件泊松随机搜索
本文提出了一种新的随机解码策略 —— 条件泊松随机束搜索,该策略对序列生成模型中的诸多问题进行了优化,并且在实验中得到了验证。
- 基于高效影响函数的统计学习揭秘
本文介绍了如何利用 efficient influence function 来构建基于统计 / 机器学习的 estimators,并讨论了这些 estimators 表现良好的前提条件。