- 机器人学习工作:人在环内,部署期间的自主学习
本文介绍了一种基于机器人学习的新框架 ——Sirius,通过人机分工实现了安全部署和复杂任务的有保障合作,并且利用了一种新的学习算法 —— 基于加权行为克隆技术,在模拟环境和真实硬件上均表现出色。
- 基于图的赌博机学习
本论文研究了一种称为图赌博机的多臂赌博机扩展问题,提出了一种能够利用乐观原则平衡长期探索与开发的学习算法 G-UCB,并证明其能够达到理论最优的遗憾界,数值实验结果表明该算法优于其他基准算法。
- ECCV通过样本级标签融合从多注释器嘈杂标签中学习
通过多项标注者提供的多个嘈杂标签代替一个准确标签来学习分类器的研究:提出了一种基于标注者和数据样本的标签错误学习算法,并在 MNIST、CIFAR-100 和 ImageNet-100 上优于同类算法。
- CVPR我需要多少更多的数据?—— 预估下游任务的需求
本文研究机器学习系统的数据需求估计问题,通过探究一系列广义幂律函数来更准确地估计数据集规模与目标性能之间的关系,并通过引入校正因子和多轮数据采集策略来优化数据需求估计模型,从而实现开发时间和数据获取成本的节省。
- 抗因果领域偏移的不变和可迁移表示
在这篇论文中,我们研究了特定概念下的领域转移下的表示学习,该表示学习方法需要同时考虑因果不变性和 “反因果” 结构,并且可以有效地处理实际世界的分类问题。我们证明了如何将因果假设转化为学习原则,分解 “不变” 和 “非稳定” 特征以获得更好 - ICML战略表现
该研究旨在解决用户如何根据机器的战略表征做出良好选择的问题,提出一种对抗机制学习算法,最小化误差并加强对抗能力。
- ICLR随机控制系统中的稳定策略学习
本文探讨了如何使用单个学习算法共同学习证明其稳定性的證明的策略,结果显示需要对策略进行某种形式的预训练才能成功修复和验证策略。
- 递归迭代问题中的分支学习方法预测与优化
本文提出了 Branch & Learn 框架,用于通过构造递归算法来直接建立相应的学习算法并解决包含未知参数的优化问题。经过广泛的实验,我们的提议表现优于经典方法和现有技术。
- AAAI可证明高效因果模型强化学习用于系统化泛化
该论文提出了一种基于因果视角的可行的系统性泛化的公式,并基于特定的结构假设提供了一种简单的学习算法,以多项式样本复杂度保证任何所需的规划误差。
- 数据模型:从训练数据中预测预测
提出一种数据建模框架, 可以分析训练数据集对模型行为的影响,通过建立参数化函数,预测数据子集对于训练后的模型的影响并导出各种机器学习应用。
- 学习高斯及更高模型的私有与多项式时间算法
提出了一个将差分隐私统计估计转化为无差分隐私的框架,并给出了用于学习高斯分布和鲁棒学习高斯分布的多项式时间差分隐私算法,该方法中学习高斯分布的样本复杂度和已知的信息论样本复杂度的上限相匹配,并且还证明了相似的结果,其中鲁棒学习高斯分布的样本 - AAAI有限时段不静态多臂多动作赌博机的强化学习
本文研究的是带有多动作的有限时间不安定多臂赌博机问题,提出了一种可行的指数策略 Occupancy-Measured-Reward Index Policy 以及一种学习算法 R (MA)^2B-UCB,相比现有算法在遗憾和运算量等方面表现 - EMNLP不同标注数量下的学习:从零到多标签
该研究论文通过在一小部分训练样例中为每个样例分配多个标签的方法,提出可通过利用不同标注数量的训练样例,设计高效的学习算法,提高自然语言处理的任务表现。
- 记忆、分解还是幼稚:CTR 预测最佳特征交互方法的学习
研究了通过建模特征交互来提高 CTR 预测模型性能的方法,并提出了一种通用框架 OptInter,能够自动搜索最佳建模方法以及对 CTR 模型进行优化,实验显示,OptInter 可以将最佳基准 Deep CTR 模型的性能提高多达 2.2 - ACL通过问答提高摘要生成的事实一致性
本文提出了一种解决摘要生成模型中可能存在错误信息的方法,策略包括评估指标度量、新型学习算法、人工评估等,并通过大量实验证明该方法对提高信息事实准确性和提高摘要整体质量都非常有效。
- 在线适应的人类模型分析
本研究模拟机器人学习算法为动态系统,控制为机器人观察到的人类数据,利用可达性分析和最优控制解决机器人在线学习参数的安全问题,并在自主驾驶和室内导航等四个领域展示了其实用性。
- ICLR利用模块化网络与任务驱动 先验知识实现高效连续学习
本文提出一种基于模块化架构和任务驱动的先验知识的学习算法,能够有效地处理长时间序列任务,且在常规连续学习基准测试上表现出了竞争优势。
- KDD神经网络训练的最小作用量原理
通过将神经网络视为一种随时间推移的动力系统,我们发现网络的输运映射中存在低动能位移偏差,并将其与泛化性能相关联,从而提出了一种新的学习算法,该算法可自动适应给定任务的复杂度,并在低数据情况下产生具有高泛化能力的网络。
- 测试误差的交叉验证置信区间
研究了交叉验证的中心极限定理和渐近方差一致估计,为 $k$ 折测试错误的可实现渐近精确置信区间和有效的假设测试提供了理论框架,并且在真实数据实验中表现优异。
- 自组织民主化学习:迈向大规模分布式学习系统
本文提出了一种分布式学习算法 DemLearn,以实现 Dem-AI 哲学中分布式机器学习系统所需的政治化学习方法,其采用自组织分层结构机制、联想聚类机制以及学习机制,并在 MNIST、Fashion-MNIST、FE-MNIST 和 CI