关键词high-dimensional datasets
搜索结果 - 26
- 眼光:通过指路明灯快速数据探索
本文介绍了一种名为 Foresight 的可视化建议系统,可通过 “guideposts” 帮助用户快速探索大规模、高维度数据,该系统提供全球可视化排名度量值,以帮助用户探索网络的指引桩,而非数据属性和可视化编码。
- 结构化低秩矩阵分解:全局最优、算法和应用
本文研究了一种适用于大规模数据集且通过使用特定形式的正则化来捕获因素中的额外结构的矩阵分解技术,该技术将已知的正则化器(如总变化和核范数)作为特定情况。 尽管所得到的优化问题是非凸的,但我们证明如果因素的大小足够大,在某些条件下,任何因素的 - CrossCat: 一种完全贝叶斯的非参数方法,用于分析异质的高维数据
CrossCat 是一种用于高维数据分析的通用方法,其基于一种层次化非参数模型用于数据表,并结合了混合建模和贝叶斯网络结构学习的优势,通过可扩展的 Gibbs 采样推断方法进行推断,可适用于多个领域的异构数据且具有竞争性的预测精度。
- 双重查询:针对高维数据的实用私有查询发布
提出了一种实用的差分隐私算法,可以回答高维数据集上的大量查询,并将计算困难的步骤封装为一个简洁定义的整数规划问题,以实现高效的回答。通过在 Netflix 数据集上的实验,证明了该算法的精度和隐私性定理,并提出了比现有技术显著改进的方案。
- 凹惩罚估计稀疏高斯贝叶斯网络
本文提出了一种基于得分的结构学习快速算法的罚似然估计框架,该快速算法不受限制地处理高维数据集,并使用凹规则化以解决估计问题的固有不可识别性。其中,高斯贝叶斯网络是重点研究领域之一。
- ICML从极高维度数据中发现支持和相关特征
本文提出了一种新的学习范式,以自动从非常高的维度中识别出信息丰富且相关的特征组。通过利用相关度量作为约束条件,我们提出了一种有效的嵌入式特征选择方法,可以识别出最优的有区分性而且不相关的特征子集,即所谓的支持特征。在学习过程中,还可以发现与