基于协同学习的在线结构化预测

May, 2012

Online Structured Prediction via Coactive Learning

Pannaga Shivaswamy, Thorsten Joachims

TL;DR我们提出了协同学习作为一个学习系统和人类用户之间交互的模型，其共同目标是为用户提供最大的效用结果。我们证明这种反馈可以从可观察的用户行为中推断出来，并且我们展示了在电影推荐任务和 Web 搜索排名任务中协同学习算法的应用。

Abstract

We propose coactive learning as a model of interaction between a learning system and a human user, where both have the common goal of prov

coactive learning interaction learning system human user utility

发现论文，激发创造

本地最优问题求解的协同学习

介绍了一种新的在线问题求解方式 —— 共同学习，将该方法应用于一些难以得出全局最优解，或仅能对局部解做微小改进的问题中，并通过理论分析和实验方式评估该方法的有效性。

Apr, 2014

从在线协作反馈中学习操作任务的偏好

本文提出了一种在线无监督学习框架，可以在包容环境下的多种对象和人类互动中学习机器人的移动路径偏好，并在家政和菜店两种环境中测试了算法，结果表明只需几分钟即可训练机器人。

Jan, 2016

多重好处：在线监督学习中的稳健模型选择

本文提出一种能够在线预测的算法，能够在概率和对抗性设置下与未知复杂度的情境树专家相竞争。通过将结构风险最小化的概率框架纳入现有的自适应算法中，我们不仅可以稳健地学习存在随机结构的同时获得正确的模型阶数，并取得了能够与拥有强侧面信息的最优算法竞争的遗憾边界，从而提供了对模型和随机性同时适应性的第一个具体保证。

May, 2018

鲁棒交互式学习的通用框架

提出了一种基于 Angluin 等人的等效查询模型和 Littlestone 的在线学习模型的交互式学习模型的一般框架，旨在利用少数迭代来学习地面真实模型，该模型基于图表示和用户反馈，但是这不一定要求相应的权重在信息安全的环境下 100% 正确。

Oct, 2017

通过迭代改进学习机械臂的运动轨迹偏好

本文介绍了一种基于协同在线学习框架的方法，通过给机器人提供用户轨迹的偏好反馈而不是直接演示最优轨迹来教授其物体操作任务，理论上说明了该方法的可行性并在多项超市结帐任务中验证了其普适性。

Jun, 2013

激活学习：联合优化系统和用户需求

提出了一种新的主动学习方法，旨在优化主动学习系统和用户之间看似矛盾的目标，以达到在教育应用中快速学习预测一种练习是否适合特定用户，同时只向用户提供符合他们技能的练习，并通过实际用户数据表明，该方法更好地满足了用户的双重目标。

May, 2020

学习用户偏好以促进共享经济中的探索行为

通过向用户提供货币奖励来激励他们探索他们可能不会选择的选项是一种有效的方法，使用结构信息模型化为凸约束来学习合适的激励是最佳选择，我们提出了一种新颖的算法 - Coordinated Online Learning（CoOL）用于学习，我们通过测试 Airbnb 上公寓的数据来验证我们的方法是可行的，该方法有助于增加探索。

Nov, 2017

通过主动数据采购实现低成本学习

本研究致力于设计在线数据采购机制，旨在使代理人能够通过使用过去的数据主动定价以购买未来的数据，同时即使代理人透露数据的成本取决于数据本身，也能给出学习保证。我们的算法和分析是构建在无悔学习模型上的，具备基于预算约束条件下的风险控制保证，且使用的主要资源是金钱。

Feb, 2015

成本敏感分类的主动学习

我们针对多分类成本敏感分类问题设计了主动学习算法：通过回归每个标签的成本并预测最小值来进行预测，它只查询可能最好的标签，忽略不可能的失败者，我们证明了 COAL 可以高效地实现任何支持平方损失优化的回归函数家族；它还享有与预测性能和标签工作量相关的强大保证。我们在真实数据集上将 COAL 与被动学习和几种主动学习基线进行了经验比较，证明在标签工作量和测试成本方面有显着的改进。

Mar, 2017

最佳优化社交环境中的合作学习

协作学习中，网络代理以自己拥有的分类器通过交流或观察其他代理的预测进行动态更新，研究了在此情景中如何优化预测以提高整个网络的准确性，并提出了多项式时间算法和近似算法来实现优化的目标。

May, 2024