- MM高性能核机器:隐式分布式优化和随机化
本文提出了一个基于分布式凸优化和随机化的算法框架和高性能实现,以实现基于核方法的统计模型的海量规模训练,以便有效地利用大数据。
- 多品项拍卖中的 n 对 1 投标人减少及其应用
本文在 $k$ 个物品 $n$ 个竞标人拍卖中引入了一种新颖的方法,可以将其简化为 $k$ 个物品 $1$ 个竞标人拍卖。这种被称为 “最佳猜测” 的方法可以应用于拍卖理论中的若干核心问题,并且可以通过任何随机机制获得至少最优收益的确定性机 - KDD可扩展核聚类:近似核 k-means
本文提出了一种基于随机化的近似核 K-means 簇算法,其利用采样点与数据集中所有点之间的核相似性来近似聚类中心,实现了与传统低秩核近似聚类方案相比更好的聚类性能、更短的运行时间和更小的内存需求,最后利用集成聚类技术进一步提高算法性能。
- NIPS直播预测器的反馈检测
本文探讨了部署在现实生产系统中的预测器可能扰动其用于做出预测的特征的问题,引入了一种局部随机化方案,用于检测实际问题中的非线性反馈, 并以一个作为搜索引擎一部分目前部署的预测系统为案例进行了试验研究。
- 用于精确最近邻搜索的随机划分树
通过分析三种 k-d 树的变体,我们确定了一个简单的潜在函数,该函数能直接反映数据集和查询点难度,并在正增长测度和主题模型中限制了该潜在函数。
- ICML典型相关分析的高效降维
该论文提出了一种快速的算法,用于近似计算规范相关分析。算法通过随机降维变换来缩小输入矩阵的尺寸,并对新的矩阵对应用 CCA 算法,从而计算出与原始矩阵对应的近似 CCA,且需要比最先进的准确算法更少的操作。
- 通过 Johnson-Lindenstrauss 引理加速随机 Kaczmarz 方法
本文介绍的修改版本的随机 Kaczmarz 方法,在每次迭代中从随机选择的集合中选择最佳投影,通过使用 Johnson-Lindenstrauss 维度缩减技术仅增加额外预处理时间,表现出显著的收敛加速。
- 隐私保护 k 安全求和协议
本文提出了一种通过数据分割与随机化技术实现安全多方计算中隐私保护的求和计算方法。
- 有限种类的物种抽样模型
本文介绍了一种具有简单更新规则的可交换分区的两个参数家族。该分区与有限多个类型的标准对称 Dirichlet 种类抽样模型的随机化版本对应,并得到了类型数量的幂律分布。
- 利用随机性发现结构:构造近似矩阵分解的概率算法
本文介绍了一种用于构建随机算法的模块化框架,以进行矩阵分解,通过随机抽样识别矩阵的大部分内容,并将输入矩阵压缩到子空间,这种方法在精度、速度和鲁棒性方面都比传统方法更具优势,能够更好地解决大数据集合的问题。
- 倾斜决策树诱导系统
提出了一种使用随机化和确定性山爬算法相结合的 OC1 系统,用于构建倾斜决策树来更准确、更高效地处理数值型属性,实验证明了 OC1 系统在构建倾斜决策树方面的优越性。