介绍了一种新的在线问题求解方式 —— 共同学习,将该方法应用于一些难以得出全局最优解,或仅能对局部解做微小改进的问题中,并通过理论分析和实验方式评估该方法的有效性。
Apr, 2014
本文提出了一种在线无监督学习框架,可以在包容环境下的多种对象和人类互动中学习机器人的移动路径偏好,并在家政和菜店两种环境中测试了算法,结果表明只需几分钟即可训练机器人。
Jan, 2016
本文提出一种能够在线预测的算法,能够在概率和对抗性设置下与未知复杂度的情境树专家相竞争。通过将结构风险最小化的概率框架纳入现有的自适应算法中,我们不仅可以稳健地学习存在随机结构的同时获得正确的模型阶数,并取得了能够与拥有强侧面信息的最优算法竞争的遗憾边界,从而提供了对模型和随机性同时适应性的第一个具体保证。
May, 2018
提出了一种基于 Angluin 等人的等效查询模型和 Littlestone 的在线学习模型的交互式学习模型的一般框架,旨在利用少数迭代来学习地面真实模型,该模型基于图表示和用户反馈,但是这不一定要求相应的权重在信息安全的环境下 100% 正确。
Oct, 2017
本文介绍了一种基于协同在线学习框架的方法,通过给机器人提供用户轨迹的偏好反馈而不是直接演示最优轨迹来教授其物体操作任务,理论上说明了该方法的可行性并在多项超市结帐任务中验证了其普适性。
Jun, 2013
提出了一种新的主动学习方法,旨在优化主动学习系统和用户之间看似矛盾的目标,以达到在教育应用中快速学习预测一种练习是否适合特定用户,同时只向用户提供符合他们技能的练习,并通过实际用户数据表明,该方法更好地满足了用户的双重目标。
May, 2020
通过向用户提供货币奖励来激励他们探索他们可能不会选择的选项是一种有效的方法,使用结构信息模型化为凸约束来学习合适的激励是最佳选择,我们提出了一种新颖的算法 - Coordinated Online Learning(CoOL)用于学习,我们通过测试 Airbnb 上公寓的数据来验证我们的方法是可行的,该方法有助于增加探索。
Nov, 2017
本研究致力于设计在线数据采购机制,旨在使代理人能够通过使用过去的数据主动定价以购买未来的数据,同时即使代理人透露数据的成本取决于数据本身,也能给出学习保证。我们的算法和分析是构建在无悔学习模型上的,具备基于预算约束条件下的风险控制保证,且使用的主要资源是金钱。
Feb, 2015
我们针对多分类成本敏感分类问题设计了主动学习算法:通过回归每个标签的成本并预测最小值来进行预测,它只查询可能最好的标签,忽略不可能的失败者,我们证明了 COAL 可以高效地实现任何支持平方损失优化的回归函数家族;它还享有与预测性能和标签工作量相关的强大保证。我们在真实数据集上将 COAL 与被 动学习和几种主动学习基线进行了经验比较,证明在标签工作量和测试成本方面有显着的改进。
Mar, 2017
协作学习中,网络代理以自己拥有的分类器通过交流或观察其他代理的预测进行动态更新,研究了在此情景中如何优化预测以提高整个网络的准确性,并提出了多项式时间算法和近似算法来实现优化的目标。
May, 2024