具有部分观测属性的有效学习

ICMLApr, 2010

Efficient Learning with Partially Observed Attributes

Nicolò Cesa-Bianchi, Shai Shalev-Shwartz, Ohad Shamir

TL;DR本文提出了一种高效的线性预测算法，用于从样本中仅看到少数属性的情况下学习，通过医学研究和数字识别数据的实验证明其精度高。

Abstract

We describe and analyze efficient algorithms for learning a linear predictor from examples when the learner can only view a few attributes of each training example. This is the case, for instance, in

linear predictor medical research algorithms digit recognition prediction accuracy

发现论文，激发创造

带有有限观测的线性回归

本文研究线性回归的常见变种问题，提出了基于属性选择的高效算法，并且相比之前的算法通过实验证明了效果的显著提升。

Jun, 2012

部分标签回归

本文提出了首个对部分标签回归进行研究的简单基线和改进型候选标签鉴定方法，并证明了这两种方法的模型一致性和收敛分析，在实验中验证了其有效性。

Jun, 2023

测试时个性化隐私审计和优化

本文探讨了在重要领域（如辅助法律、银行、招聘和医疗抉择的学习模型），是否需要全部的输入特征才能在测试时返回准确的预测，并表明在个性化的环境下，每个人仅需要发布一小部分的这些特征就能保证系统准确度不受影响。研究显示，在一些学习任务中，个体只需提交不到总数据的 10％即可确保与使用完整信息的模型同样准确。同时，本文还提供了一个高效的序列算法来选择哪些属性应由每个个体提供。

Jan, 2023

带有预测的算法学习

介绍了一种算法设计范例 —— 基于学习预测器的算法，将在线学习技术应用于预测器学习、调整鲁棒性 - 一致性折中并绑定样本复杂度，在构建优美的预测器的同时，在二分图匹配、滑雪租赁、页面迁移和作业调度等多场景中优化了多个现有结果，且提供了第一批基于学习理论的担保。

Feb, 2022

可以给一个例子吗？主动学习属性和关系的长尾

本文介绍了一种基于主动学习的方法，通过要求视觉场景中的属性和关系来解决目前机器学习系统训练数据不足的问题，并提出一种从数据分布长尾中获取样本的主动采样方法，证明其在视觉基因组数据集上优于传统的主动学习方法。

Mar, 2022

增强属性的有选择性零样本分类

通过使用人工定义和自动发现到的残差属性，提出了一种基于选择性零样本分类器，通过在人工定义属性的子空间中进行预测并使用定义和残差属性来度量预测置信度，以解决分类器在选择分类场景中做出可疑预测的问题，并在多个基准测试中证明了其优异的表现。

Jul, 2018

评估不确定和不完整信息下机器学习模型的公平性

研究公平分类器培训和评估的挑战，探讨对数据点的敏感属性信息和标签信息的公平性指标依赖性，以及在数据缺乏的情况下如何训练和使用属性分类器进行偏差估计。

Feb, 2021

从聚合观察中学习

本文提出了一个概率框架，将多实例学习扩展到多类分类和回归等其他问题，并引入一种新的一致性概念来表征估计器，证明了在温和的假设下具有良好的收敛性。实验证明，该方法在三种问题设置中具有有效性。

Apr, 2020

有效学习预测人类能力的辅助模型

这篇论文介绍了在专家推迟决策的场景下，利用学习算法提高决策准确性的方法，通过分析一系列代理损失函数的理论性质，设计并使用最小量的数据训练出高效准确的决策系统。

Jul, 2022

多个噪声部分标注者中学习

本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础，通过对 3 个文本分类和 6 个对象分类任务的评估，证明了部分标注的效果可达到 8.6% 的平均准确率提高，进而探讨了部分标注在零样本对象分类任务中的应用以及与最新零样本学习方法相比的效果。

Jun, 2021