- 使用语言模型压缩搜索
通过使用预训练语言模型量化搜索词并创建低维度、内存高效且有效地充当搜索摘要的搜索数据表示方法,以及使用仅有的搜索数据估计真实世界事件的约束搜索模型(CoSMo),本文展示了使用仅有的 Google 搜索数据高准确度地估计美国汽车销售和流感率 - 条件贝叶斯求积
我们提出了一种新的方法,用于估计昂贵的样本或积分估计的条件或参数期望。通过概率数值方法的框架(如贝叶斯求和),我们的新方法允许结合关于积分和条件期望的先验平滑性知识从而提供一种量化不确定性的方式,并在贝叶斯敏感性分析、计算金融和不确定性决策 - 在光滑条件下估计一个函数及其导数
从一个嘈杂的数据集中估计未知函数 f * 及其偏导数,对两种估计器进行了证明、一致性研究及收敛速率分析,并在对股票期权和其二阶导数估计为基础股票价格函数的情况下进行了数值验证。
- AAAI核化归一化常数估计:连接贝叶斯求积和贝叶斯优化
在本文中,我们研究了通过对黑盒函数进行查询来估计正规化常数∫e^{-λf (x)} dx 的问题,其中 f 属于再生核希尔伯特空间 (RKHS),λ 是问题参数。我们发现,在估计正规化常数时,难度水平取决于 λ 的值:当 λ 趋近于零时,问 - 鲁棒估计因果异方差噪声模型
通过使用学生 t 分布提出了一种估计异方差噪声模型的新方法,以解决现有估计方法在数据分布非高斯时存在的亚优和不稳定问题,并成功地在合成和真实基准测试中表现出更好的鲁棒性和整体性能。
- 使用强化学习近似凸包
使用随机控制方法估计非凸函数的凸包问题,并基于此开发了强化学习方案来近似凸包,使用改进的 Q 学习方法进行控制性最优停止,在标准测试题库上取得了非常有希望的结果。
- 通过整数规划对温顺函数进行分段多项式回归
我们考虑估计属于一类非光滑函数(称为 tame 函数)的函数的任务。我们展示了 tame 函数可以通过分段多项式在任何全维度立方体上进行逼近,并且提出了首个混合整数规划形式的分段多项式回归。这些方法可以用于估计 tame 函数,并展示了有希 - 超级学习者中变量筛选的实际考虑
预测函数估计是许多数据分析的基本组成部分。Super Learner 集成是一种特定的层叠实现,具有可取的理论性质,并已成功应用于许多领域。在拟合其他预测算法之前,可以通过在集成中使用包括 Lasso 在内的变量筛选算法来实现维度降低。然而 - 高效计算的神经网络评分
通过引入一个复合分数来衡量精确度和功耗在神经网络推断过程中的权衡,本文提出了一个新的开源工具,使研究人员能够考虑更多的指标,包括细粒度的功耗、RAM/CPU/GPU 利用率,以及存储和网络的输入 / 输出。该方法被用于探索神经网络的能耗和精 - CRYPTO-MINE:基于互信息神经估计的加密破解
在密码学领域中,我们提出了一种全新的方法来估计明文和密文之间的互信息,通过应用神经网络来评估密码系统的效率,并分析了多种加密方案和基准方法的效果,同时探讨了信息泄漏与输入分布之间的关系。
- Prodigy: 一种快速自适应且免参数的学习器
描述了两种技术,Prodigy 和 Resetting,来可靠地估计自适应方法中学习率的距离,从而优化学习率设置,并在多个基准数据集上测试了这些方法,结果表明其收敛速度有所提高。
- 联邦学习中的类别不平衡调查
本文针对联邦学习中的数据不平衡问题,介绍了目前研究中针对该问题的进展,包括不需要真实数据的数据不平衡程度评估方法、数据不平衡处理方法及其优缺点、常用的评估指标,以及未来的研究方向。
- 私有 ERM 中隐私保护的实用性差分隐私:理解 Epsilon 对实用性的影响
通过理论探索差分隐私强度参数 epsilon 对学习模型效用的影响,建立并提出了一种可以在任意 epsilon 值下对效用进行估计的实用方法,该方法在实验结果表现出高精度估计和广泛适用性,同时能够在保障隐私的前提下提供较强的效用保证。
- 面向可扩展的因果 DAGs 贝叶斯学习
本文提出了贝叶斯因果推断的方法,其中用到了 MCMC 方法来进行图结构的采样,并得到了线性高斯 DAG 模型的因果效应估计。
- AAAI学习反事实表示以估计个体剂量 - 反应曲线
本文通过机器学习方法和神经网络构建一个新的潜在结果框架,通过表现指标、模型选择标准、模型架构和基准实验估算个体剂量反应曲线,确定在估算个体剂量反应方面的最新技术水平。
- 估计流形维度的最小极小率
本文研究了机器学习和计算几何中的一些问题,主要关注于如何准确估算支持概率分布的流型的内在维度,同时提出了相应的上下界极值估算公式。
- Chebyshev 多项式、矩匹配和未知量的最优估计
针对最小非零质量至少为 1/k 的离散分布估计支撑阈大小的问题,我们提出了一种基于 Chebyshev 多项式的线性估计器,其样本复杂度达到了普适常数因子 k/logk * log^2 (1/epsilon),并展示了在合成和真实数据集上的