本文提出一个算法,利用一种 “从一致的主动学习到具有保证错误的置信度评估预测” 的减少,以及一种新颖的置信度评估预测器解决了确保标签复杂度更低的主动学习问题。
Jul, 2014
本论文提出了一种用于多组学习的主动学习算法,以最小化标签查询数并保持 PAC 学习保证,其中包括分类准确度,标签查询和不一致系数等关键词。
Jun, 2023
通过对多个带敏感性群体的个体进行损失度量,本文提出了用于处理公平性关切的多组无知 PAC 可学习性算法,该算法可以保证在涵盖多个不同的群体时仍能保证所学分类器表现一致,通过联合和扩展以前针对特定损失函数的多组公平性文献中的研究,为包含敏感性群体的学习提供了一个统一的视角。
May, 2021
针对给定的二元假设类和分布,该研究提出了一种与最优算法相竞争的无偏主动学习算法,该算法在错误率为 η 的情况下只需要 O (m^* log |H|) 的查询次数,并且证明了超越 O (log |H|) 的开销是 NP 难的。
Oct, 2023
对于分布学习问题,我们研究了可学习性和鲁棒(或不可知)可学习性之间的关系,发现与其他学习设置(例如函数类的 PAC 学习)相反,概率分布类的可实现学习性并不意味着其不可知可学习性。我们进一步研究了什么样的数据损坏可以破坏分布类的可学习性以及该可学习性对于怎样的损坏是鲁棒的。结果表明,概率分布类的可实现学习性仅对加性损坏具有鲁棒性,而不具备对减性损坏的鲁棒性。我们还探索了与压缩方案和差分隐私可学习性相关的含义。
Jun, 2024
本文讨论机器学习算法在环境未完全准确的情况下的应用,尤其是面对对抗攻击和分布变化的情况下,引入新的鲁棒性可靠性保证,并提供优秀的学习方案,分析了可靠性区域,同时分别分析了近似对数凹分布和平滑概率分布下的线性分类器和光滑边界分类器的可靠性区域中可靠性区域的概率质量上界。
Apr, 2023
该研究论文介绍了可测试学习的概念,并研究了在测试者接受标准高斯数据的情况下,多项式阈值函数的可测试学习。研究结果表明,任意常数阶的多项式阈值函数在多项式时间内可以以超出误差 ε 的程度可测试地学习,与测试属性的典型模型相匹配。同时,该研究证明了直接证明可测试学习(而非愚弄测试者)的方法在多项式阈值函数上是行不通的。
本文提出一种基于新的优化问题的主动学习算法,在流式环境下,可有效地解决任何分类器表示和分类问题,且具有高效实现的特点,并证明了该算法比现有的所有满足前两个特点的算法更为优秀,并对所有高效的主动学习算法进行了第一次实验分析,评估了它们在不同场景下的优劣。
Jun, 2015
探讨在机器学习中存在恶意数据时的问题,其中的 list-decodable learning 和 semi-verified learning model 框架及稳健学习算法提供强大的解决方案。
Nov, 2016
提出一种基于统计学习框架的主动学习算法,能够高效地处理随机分类噪声和差分隐私,且可将其转换为能容忍分类噪声的主动学习算法,同时也实现了用指数级别的误差提高标签节约的差分隐私主动学习算法.
Jul, 2013