主动序贯学习机器教学

Sep, 2018

Machine Teaching of Active Sequential Learners

Tomi Peltola, Mustafa Mert Çelikok, Pedram Daee, Samuel Kaski

TL;DR本文探讨了机器教学的问题，提出了基于马尔可夫决策过程的序列教学问题。通过研究多臂老虎机学习器的模拟实验和用户研究，探究了教学规划和学习者具有教师模型两种方法对于学习效果的影响，分别从学习者的角度和教师的角度考虑互动智能系统的策略行为，提供了新的研究方法。

Abstract

machine teaching addresses the problem of finding the best training data that can guide a learning algorithm to a target model with minimal effort. In conventional settings, a teacher provides data that are consistent with the true data distribution. However, for →

machine teaching sequential learners markov decision process learner modeling interactive intelligent systems

发现论文，激发创造

迭代式机器教学

本文探讨了机器教学的逆问题，提出了一种新的范例，即学习者使用迭代算法，教师可以根据学习者当前的表现顺序地、智能地提供示例。它着重于实现学习者模型的快速收敛，可以通过设计教学算法减少教学示例并比没有教师进行教学的学习实现更快的收敛。

May, 2017

序贯决策环境中的动态教学

在一个连续的决策环境中，我们描述了教授模型的理论界限和实用算法。我们聚焦于决策者作为一位决策者而不是一位观察策略的老师优化学习者的之前努力，并提出了几个基于先前定义的监督规程的教学框架，例如教学维度，并将它们扩展到处理在 MDP 中遇到的噪声和输入序列。同时，我们还提供了在这种情况下几个重要的模型类的可学性上的理论界限，并建议一个动态教学的实用算法。

Oct, 2012

黑盒迭代式机器教学

本文介绍了一种跨空间机器教学的方法，提出了主动查询学习者的机制以提高收敛速度，并比较了不同教师模型的实验验证结果。

Oct, 2017

智能教学系统的多臂赌博机

本文介绍了一种智能辅导系统的方法，该系统根据学生特定的时间和动机资源，自适应地个性化地最大化学习活动序列，以提高学生的技能，利用了内在动机学习的最新模型，并运用多臂老虎机技术进行优化，同时基于专家知识来加速探索初始启动

Oct, 2013

强化学习中的主动教师选择

隐藏效用强盗（HUB）框架及主动教师选择算法（ATS）在多教师情境下学习准确奖励模型方面表现出色，为活跃教师选择提供了有力支持，并促进了对于强化学习的未来研究。

Oct, 2023

机器教学中适应性的作用探析：以版本空间学习算法为例

本文研究了交互式环境下如何基于学生当前状态，用一种新的模型进行自适应教学，提高版本空间学习者的学习效率和可理解性。通过有效算法和用户测试，验证了提出的模型相较于现有模型的多种优点。

Feb, 2018

机器教学：构建机器学习系统的新范式

本文探讨了机器教学的范式转变，并提出将与机器学习算法有关的知识与教学过程进行脱耦，以加速创新和赋能数百万新的机器学习模型应用。

Jul, 2017

主动自适应的序列学习

提出了一种主动和自适应地解决一系列机器学习问题的框架，该框架通过使用一些未标记数据池中的最具信息量的样本，利用先前步骤中获得的信息，使用基于随机梯度下降的主动学习算法来实现近乎最优的风险性能，并构建了一个学习问题变化的估计器，通过使用主动学习样本提供一种自适应的样本大小选择规则，以保证足够的时间步数时超额风险是有界的。

May, 2018

教学的学习

本文介绍一种名为 “学习教学” 的方法，它利用两个智能代理相互交互：一个学生模型和一个教师模型。教师模型利用学生模型的反馈来优化自己的教学策略，以达到教师和学生的共同进化，并在各种机器学习任务下通过使用深度神经网络等模型来展示这一方法的实用价值。

May, 2018

一次性机器教学：较少的示例成本更快地收敛

本文提出了一种更智能的机器教学范式，即一次性机器教学，并建立了可行的映射方法设计最优化（通常为最小）教学集，以便更快地收敛，从而证明了新教学范式的智能性并验证了该策略的有效性。

Dec, 2022