- 数据科学中的带符号图与可通信几何
基于有向图的通信性几何概念,提出了一种解决有冲突交互数据分析问题的统一方法,包括有向图的划分、降维、联盟等级的确定以及衡量系统中已存在派别间极化程度的量化。
- 简洁的互动感知解释
我们提出了一种将特征分割为显著相互作用的部分,并利用这些部分形成简明易解的加性解释的方法。实验证明,我们的解释比 SHAP 和 NSHAP 的解释更准确、更易理解。
- 利用半定规划进行人群聚类的去偏置和局部分析
本文讨论了从一个混合的子高斯分布中抽取的规模为 n 的小数据样本的分区问题,并分析了同一作者提出的计算有效算法,通过一个小样本按照其来源人群将数据大致分为两组。从这篇论文中,我们得出结论:当信噪比 s^2 被一个常数下界限时,误分类错误以指 - 数值属性的离散化:人类感知的分析
本研究通过收集人类和数据科学、统计学以及工程专家的反馈,分析了数值属性的分割,提出了两种度量方法,结果显示约 68.7% 的人类反馈与我们的度量方法一致,因此我们的度量方法可作为一种用于数值属性离散化的方法之一。
- 带有性能保证的 ρ-POMDP 中的测量简化
该研究论文介绍了一种有效的决策制定方法,通过对高维观测空间进行划分,并利用这种划分提出了分析边界,以求得期望的信息论奖励,进而在保证性能的同时实现高效规划。该方法在高斯置信度上表现出至少 4 倍的理论性能改善,在模拟和实际实验中也相对其他先 - 最小二乘最大值与加权泛化记忆机
本文提出了一种新的记忆影响机制,通过引入最小二乘支持向量机(LSSVM)的记忆机制,在不改变原始 LSSVM 的等式约束的情况下,实现了对训练集的精确划分而无过拟合现象。提出了最大记忆影响模型(MIMM)和加权影响记忆模型(WIMM),证明 - 分片贝叶斯加性回归树
开发了基于随机切片的贝叶斯加性回归树(SBT)模型,通过引入随机化辅助变量和分片树来决定数据分片,并使用贝叶斯加性回归树(BART)将每个分区组件拟合到子模型中。通过引入交集树结构完全指定切割和建模,通过实验和推导理论优化权重来最小化后验收 - 可微随机分区模型
提出了一种新的两步方法来推断随机分区模型的参数,允许可变推断任务的使用,并具有可重参数化梯度,能够在对参数进行端到端基于梯度的优化时克服先前方法的限制,本方法在三个具有挑战性的实验中显示出了它的通用性。
- UpMax:用戶分區的 MaxSAT
本文提出了一种新的框架 UpMax,将分割过程与 MaxSAT 解决算法分离,使用户能够根据问题来提出分割方案,证明分割对于基于不可满足性的 MaxSAT 算法的性能有很大的影响。
- 专家树解决集体决策中的知识限制
本文研究了专家与问题实例之间的知识差异,提出了一种新算法 —— 专业树,解决了现有方法在选择适当模型时存在的问题,从而提高了性能。
- 特征重要性的固有不一致性
本文提出一种新的特征重要性得分框架,通过将特征空间重新划分成可分离集合,从而统一了现有研究所存在的不一致性,实现了对机器学习算法的可解释性。
- WawPart: 知识图谱的工作负载感知分区
本研究提出了一种基于查询工作负载的知识图谱分区方法,通过聚类查询和重写查询来减少分布式关联并优化工作负载性能。实验结果表明了该方法在工作负载处理时间上的性能提高。
- AWAPart:适应工作负载的知识图谱分区
本篇文章提出了一种自适应分区方法,可应对大规模知识图谱中查询工作量变化的需求,通过动态适应知识图谱三元组的分区,可以提高查询处理时间的性能。
- ICML神经网络的多速率训练
本文提出了一种多速率神经网络训练方法,将神经网络参数划分为 “快速” 和 “慢速” 部分,在不同的时间尺度上进行训练,从而获得传输学习任务的显著计算加速。我们通过在视觉和 NLP 应用中 fine-tune 深度神经网络,证明了我们可以在几 - ICML使用递归分区的黑盒密度函数估计
本文提出了一种贝叶斯推导和计算的新方法,通过递归划分样本空间来定义,并通过有效的数据结构组织划分来近似整个密度函数以及规范化常数,可用于证据估计或快速后验采样,并具有与最新技术相当的性能。
- 门控变分自编码器:融合弱监督以促进解缠
本文讨论了利用弱监督方法进行可变自编码器(Variational AutoEncoders,VAEs)的训练过程,并提出了一种称为 Gated-VAE 的新模型来实现 VAEs 的解缠结性。该方法包括对表示嵌入进行划分和门控反向传播。实验结 - CVPR基于同情保守原则的图像分割平衡剪枝算法
本文提出 Compassionately Conservative Balanced (CCB) Cut costs 算法,可用于解决图像分割问题,该算法基于 NCut 目标函数,针对单一分区得分问题提出了一种新的解决方法,并通过 BSDS - 平衡量化:一种有效、高效的量化神经网络方法
本文提出了一种新的量化方法,可以确保量化值分布的平衡性,通过对参数进行分位数递归划分并应用均匀量化,可以提高 QNN 的预测准确性,同时对训练速度几乎没有影响,并可适用于卷积神经网络和循环神经网络。
- ICLRLSTM 网络的分解技巧
本文提出利用矩阵因子分解和矩阵划分两种方法来降低参数数量和加速训练大型 LSTM 网络的方法,并成功实现了在参数数量显著减少情况下接近最先进水平的困惑度。
- 统一超图划分:可证张量方法和采样技术
本文基于之前的研究,在计算机视觉中解决超图分割的问题,并提出可以证明的高效分割算法,同时对各种超图分割方案进行了详细的实证比较。