具有部分观测属性的有效学习
本文探讨了在重要领域(如辅助法律、银行、招聘和医疗抉择的学习模型),是否需要全部的输入特征才能在测试时返回准确的预测,并表明在个性化的环境下,每个人仅需要发布一小部分的这些特征就能保证系统准确度不受影响。研究显示,在一些学习任务中,个体只需提交不到总数据的 10%即可确保与使用完整信息的模型同样准确。同时,本文还提供了一个高效的序列算法来选择哪些属性应由每个个体提供。
Jan, 2023
介绍了一种算法设计范例 —— 基于学习预测器的算法,将在线学习技术应用于预测器学习、调整鲁棒性 - 一致性折中并绑定样本复杂度,在构建优美的预测器的同时,在二分图匹配、滑雪租赁、页面迁移和作业调度等多场景中优化了多个现有结果,且提供了第一批基于学习理论的担保。
Feb, 2022
本文介绍了一种基于主动学习的方法,通过要求视觉场景中的属性和关系来解决目前机器学习系统训练数据不足的问题,并提出一种从数据分布长尾中获取样本的主动采样方法,证明其在视觉基因组数据集上优于传统的主动学习方法。
Mar, 2022
通过使用人工定义和自动发现到的残差属性,提出了一种基于选择性零样本分类器,通过在人工定义属性的子空间中进行预测并使用定义和残差属性来度量预测置信度,以解决分类器在选择分类场景中做出可疑预测的问题,并在多个基准测试中证明了其优异的表现。
Jul, 2018
研究公平分类器培训和评估的挑战,探讨对数据点的敏感属性信息和标签信息的公平性指标依赖性,以及在数据缺乏的情况下如何训练和使用属性分类器进行偏差估计。
Feb, 2021
本文提出了一个概率框架,将多实例学习扩展到多类分类和回归等其他问题,并引入一种新的一致性概念来表征估计器,证明了在温和的假设下具有良好的收敛性。实验证明,该方法在三种问题设置中具有有效性。
Apr, 2020
这篇论文介绍了在专家推迟决策的场景下,利用学习算法提高决策准确性的方法,通过分析一系列代理损失函数的理论性质,设计并使用最小量的数据训练出高效准确的决策系统。
Jul, 2022
本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础,通过对 3 个文本分类和 6 个对象分类任务的评估,证明了部分标注的效果可达到 8.6% 的平均准确率提高,进而探讨了部分标注在零样本对象分类任务中的应用以及与最新零样本学习方法相比的效果。
Jun, 2021