- 基于拓扑数据分析的可靠恶意软件分析和检测
使用代数拓扑的方法(TDA)来分析和侦测复杂的恶意软件模式,发现 TDA Mapper (结合 PCA) 在聚类和发现隐藏的恶意软件集群方面比 PCA 更好,持久图用于识别重叠的恶意软件集群。可以使用随机森林和决策树,以及 t-SNE 和持 - 用语言表述决策树状态解释自主性
该研究旨在提供一个框架,以易于理解的方式解释自主车辆在任务期间所采取的决策和行动,并具有与任何自主体系结构叠加的自主性无关的系统。
- 基于规则加权专家系统选择大学合格的教练员
本文介绍了一种基于规则的专家系统,该系统可以自动选择合适的教师来教授某门课程,并使用决策树和多数表决算法来提高系统的准确性。在真实数据的测试中,该专家系统的准确性为 85.55%,且具有实现简单和透明的特点。
- ICML基于树形排列的离散树流
本文提出了一种构建基于决策树的离散流来降低计算负担和消除伪梯度需求的方法,包括定义一种树结构的置换来高效地计算密度值和样本新数据,以及使用新的标准在每个节点上学习树结构和置换,并在多个数据集上通过实验证明了我们方法的可行性。
- 无监督的词级韵律标记技术用于可控语音合成
提出了一种基于决策树和 GMM 的无监督词级韵律标记方法,利用这种方法训练的 TTS 系统可以实现可控语音合成。实验结果显示,与 typical FastSpeech2 模型相比,使用词级韵律标记的 TTS 模型不仅具有更好的自然度,而且还 - 基于决策树模型的 AI 模型不确定性估计的硬边界缓解研究
本文旨在改善不确定性包装器框架的决策树过于严格的聚类方法,以降低不确定性估计的硬性决策边界,最终通过与 Brier 得分的实验结果以及数据驱动 AI 模型的不确定性等关键词,研究了五种减轻硬性边界的方法,其中以随机森林为最有前景的方法。
- 可解释聚类的近乎紧密且无感知算法
提出了一个算法,用于在 $k$-medians 目标和 $k$-means 目标下输出可解释的聚类,与最佳聚类最多相差 $O (\log^2 k)$ 和 $O (k\log^2 k)$ 的因子,算法时间为 $O (dk\log^2 k)$ - 高维情况下近似最优的可解释 k 均值算法
介绍了一种可解释性聚类方法,算法通过应用决策树将数据划分为轴平行超平面聚类,使得聚类边界简单,同时保证聚类代价函数的可解释性约束,聚类的代价至多是比不考虑可解释性约束的情况最小代价增加 $k^{1-2/d}$ 倍,与其他方法的代价上界取最小 - 基于深度学习和决策树的交通异常检测视觉系统
本文提出一种决策树驱动的深度学习方法,通过智能交通监测系统从交通摄像头中快速精确地提取异常事件并估计其起止时间,并通过实验验证取得了 F1 score:0.8571 和 S4 score:0.5686。
- KDD基于树型方法的广告预测历史特征自动生成
通过计数键选择方法,提高广告历史特征的构建效率,并通过决策树模型训练及基于频率的重要性度量,选择个性化计数特征,在 Twitter 视频广告数据上验证,自动识别的计数特征优于手动筛选的特征,可用于广告点击率预测。
- ExKMC: 扩展可解释的 K - 均值聚类
我们研究了基于解释和准确性之间的平衡的 $k$-means 聚类算法,设计了一种新的解释性 $k$-means 聚类算法 ExKMC,用于有效地将数据集划分为 $k'$ 个叶子节点,并以 $k$ 个簇之一的形式对叶子节点进行标记。经实验验证 - 可解释的 K 均值和 K 中值聚类
本文提出了一种使用决策树对数据集进行聚类的算法,并探讨了该方法对 k-means 和 k-medians 目标函数的适用性。作者证明了常见的自顶向下决策树算法可能会导致成本任意大的聚类结果,但设计了一种有效的方法使用具有 k 个叶子的树生成 - 朝向深度机器推理:基于原型的深度神经网络与决策树推理
提出使用基于决策树的推理和合成数据来平衡分类,具有可完整解释且不需要使用 GPU 的 DMR 原型方法和网络架构,可以有效解决多类别问题中类别不平衡的问题,并在多个基准测试问题的测试中获得最佳表现和两个世界纪录。
- Treant: 训练逃避感知的决策树
本文提出一种基于威胁模型的决策树学习算法 Treant,通过采用坚固分裂和攻击鲁棒性等两种技术手段,使得学习过程更为完整、高效,有效提高抗攻击性能。
- 对于随机平滑分类器的严格对抗鲁棒性证明
采用输入随机化生成的分类器的集合可以具有很强的鲁棒性,该方法可扩展到更广泛的分布,特别是在离散情况下保证敌对的鲁棒性,并给出了相应的算法,此外,该研究有助于通过假设分类器的函数类来提高保证,并且具有图像和分子数据集上的实际应用。
- ICML从 CNN 中提取可解释的基于概念的决策树
该论文提出了一种从 CNN 隐藏层激活中推断标记的概念数据并通过浅层决策树解释这些概念的方法,这可以提供关于 CNN 模型认为重要的概念以及这些概念如何相互作用的信息,实验表明提取的决策树在树深度较低时能够准确地代表原始 CNN 的分类,从 - 利用生成对抗网络进行数据增强
本文提出了使用生成对抗网络(GAN)生成机器学习任务的人工训练数据,以解决样本不平衡问题与个人隐私数据问题,在多个基准数据集上测试表明,使用 GAN 生成的训练数据进行决策树分类器训练可以取得与使用原始数据集训练 DT 相同或更好的准确性和 - 神经包分类
本文介绍了一个使用深度强化学习的方法来解决计算机网络中数据包分类的问题,通过策略生成决策树来优化分类时间和内存需求,并将其称为 NeuroCuts。研究表明,NeuroCuts 在分类时间中的中位数上优于现有的手工算法,可以提高达 18%, - 基于机器学习的鲁棒预测模型在现实生活中的应用 —— 以移动电话数据为例
通过使用朴素贝叶斯和拉普拉斯估计,本文提出了一种稳健的预测模型来识别和消除真实生活中手机数据中的噪声实例,以提高模型的预测准确性。实验结果显示该模型在个人手机用户的通话日志等真实生活中的手机数据上具有很好的效果和精度。
- 一种新型层次化入侵检测系统,基于决策树和基于规则的模型
本文提出了一个新颖的入侵检测系统(IDS),结合了基于决策树和基于规则的概念的不同分类器方法,即 REP 树,JRip 算法和 Forest PA,并通过分析使用 CICIDS2017 数据集的 IDS 获得实验结果表明其在准确性,检测率,