- 无监督基于增强的自编码器集成用于异常检测
提出了一种基于 Boosting 思想的 Autoencoder Ensemble 方法(BAE),它是一种无监督集成方法,利用加权采样来训练自编码器组件,并注入集成的多样性,它在各种条件下均优于现有技术水平的方法。
- SIGIR检索多实体关联性:词嵌入组合模式的评估
本研究探讨了基于流行的嵌入方法训练矢量表示的实体注释新闻语料库的应用,以预测实体参与新闻事件,并测试了一些嵌入矢量的组合模式以支持多参与实体事件查询。我们发现,虽然单一的基于词嵌入的组合模式并不能完全达到传统词共现网络的水平,但不同的嵌入方 - MM使用随机森林实现隐私保护的协同预测
本文针对协作分析中隐私和数据共享的矛盾之处,以随机森林为例,探讨了保护隐私的机器学习模型问题,并提出了一种新的集成学习方法,通过实验数据表明了新方法的高效性和潜在的准确性好处,能够用于在临床决策支持中预测模型的学习中。
- 神经网络的不确定性:近似贝叶斯集成
该论文介绍了一种基于贝叶斯原理的神经网络反演方法,利用对先验分布采样的数据正则化参数,从而提高神经网络模型的预测不确定性识别和量化能力。经过理论和实证分析,该方法相对于传统的平均集成技术具有更好的性能表现。
- 二进制集成神经网络:每个网络的比特数更多还是每个比特的网络数更多?
对二元神经网络进行了广泛的实验以了解其表示能力、速度及偏差 / 方差。提出了一种二元集成神经网络,通过集成方法来提高二元神经网络的性能,从而更快、更鲁棒,甚至能够超越具有相同结构的完全精确的浮点数网络的准确性。
- 深度神经网络对抗扰动的防御方法:集成学习
采用集成方法作为防御策略可增强神经网络在 MNIST 和 CIFAR-10 数据集中对于对抗扰动的鲁棒性。
- IJCAI基于连续时间马尔可夫链的专用分类器集成
本文探究了一种新方法,即将专用分类器的预测结果转化为一组有序对偏好,建立连续时间马尔科夫链,使用平衡分布作为最终预测,从而在大型公共数据集上取得了较大改进,特别是在分类器覆盖不平衡时。
- 深度增量提升
本文介绍一种新技术 Deep Incremental Boosting,它是从 AdaBoost 发展而来,并专门适用于 Deep Learning 方法,它可以缩短训练时间并提高泛化能力。作者借鉴了 Transfer of Learnin - CVPR大规模视频标注中的深度神经网络多样性培育
我们在 Google Cloud 和 YouTube-8M 视频理解挑战的背景下,研究了控制 DNN 多样性的因素。通过使用集成方法、模型过拟合或丢弃等方法来促进 DNN 的多样性,并介绍了我们在 Kaggle 竞赛(以 Yeti 团队的名 - 特征可变流数据下的学习
本文提出了一种新的学习范式:可变特征流式学习,通过恢复消失的特征来提高性能,开发了两种集成方法与实验数据验证了我们的提议的有效性。
- ICML自信的多选学习
本研究提出一种针对深度神经网络的新型集成学习方法,名为自信多选学习(CMCL),通过解决其过度自信的问题来提高模型的性能,CMCL 比独立集成方法在图像分类和前景 - 背景分割等任务中提高了显著的准确率。
- 一种稳健的逆优化效用学习框架
使用鲁棒的参数效用学习框架,将用户交互建模为非合作博弈,并通过集成方法扩展来提高预测性能。应用于鼓励用户节能行为的社交游戏实验中,表现出良好的性能。
- 深度卷积神经网络的集成方法在图像分类中的相对性能
该研究通过探究多种集成方法,包括超级学习器等,运用人工神经网络在图像识别任务中进行设计多个实验,并进一步研究了神经网络的过度自信现象及其对集成方法的影响,并在所有实验中发现超级学习器是表现最佳的集成方法。
- 使用堆叠泛化进行母语识别
我们用三种基于 Ensemble 的模型进行了一系列实验,测试了每种模型的多个配置和算法,并达到当前不同语言三个数据集中 NLI 的最高水平,同时我们还使用了统计显著性检验来比较 NLI 系统,展示我们的结果明显优于以往最佳水平,并提供了一 - 利用历史知识适应概念漂移
这篇论文介绍了一种新的集成学习方法,称为 Diversity and Transfer based Ensemble Learning(DTEL),用于处理概念漂移的增量学习。通过利用保留的历史模型和转移学习,DTEL 可以更有效地处理概念 - ICML进化抽样是否能提高袋装集成
本研究介绍了 Perturb and Combine(P&C)方法的一种新型演化采样法(ES),该方法采用进化算法以智能方式采样特征空间和训练样本,并使用多个适应性函数评估合奏效果,与随机采样的比较表明,此方法对于不稳定分类和回归方法的准确 - 基于词向量的中文评论情感分类实证研究
本文介绍了如何在中文情感分类中使用单词嵌入作为特征,并建立了一个包含一百万个评论的中文意见语料库。通过使用不同的机器学习方法,包括支持向量机 (SVM),逻辑回归 (Logistic Regression),卷积神经网络 (CNN) 和集成 - 通过置信区间和假设检验对随机森林中的不确定性进行量化
本文提出针对机器学习集成方法的正式统计推断程序,重点在于利用样本的子样本进行 U - 统计的预测,进而提供置信区间,以及作为检验功能、估计方差等应用。
- 多标签分类的集成方法
本文提出了将最小集覆盖问题应用于构建标签集合的通用框架,并提出两个构建约束条件以提高多标签分类的准确率和稳定性。在实验中,这种方法优于 RAKEL 算法和其它同类算法。
- 深度表征的水平和竖直集成用于分类
本文介绍了使用横向投票、纵向投票和横向堆叠集成方法来提高深度神经网络的分类性能,并在 ICML 2013 黑盒挑战中取得了不错的成绩。