主动序贯学习机器教学
本文探讨了机器教学的逆问题,提出了一种新的范例,即学习者使用迭代算法,教师可以根据学习者当前的表现顺序地、智能地提供示例。它着重于实现学习者模型的快速收敛,可以通过设计教学算法减少教学示例并比没有教师进行教学的学习实现更快的收敛。
May, 2017
在一个连续的决策环境中,我们描述了教授模型的理论界限和实用算法。我们聚焦于决策者作为一位决策者而不是一位观察策略的老师优化学习者的之前努力,并提出了几个基于先前定义的监督规程的教学框架,例如教学维度,并将它们扩展到处理在 MDP 中遇到的噪声和输入序列。同时,我们还提供了在这种情况下几个重要的模型类的可学性上的理论界限,并建议一个动态教学的实用算法。
Oct, 2012
本文介绍了一种智能辅导系统的方法,该系统根据学生特定的时间和动机资源,自适应地个性化地最大化学习活动序列,以提高学生的技能,利用了内在动机学习的最新模型,并运用多臂老虎机技术进行优化,同时基于专家知识来加速探索初始启动
Oct, 2013
隐藏效用强盗(HUB)框架及主动教师选择算法(ATS)在多教师情境下学习准确奖励模型方面表现出色,为活跃教师选择提供了有力支持,并促进了对于强化学习的未来研究。
Oct, 2023
本文研究了交互式环境下如何基于学生当前状态,用一种新的模型进行自适应教学,提高版本空间学习者的学习效率和可理解性。通过有效算法和用户测试,验证了提出的模型相较于现有模型的多种优点。
Feb, 2018
提出了一种主动和自适应地解决一系列机器学习问题的框架,该框架通过使用一些未标记数据池中的最具信息量的样本,利用先前步骤中获得的信息,使用基于随机梯度下降的主动学习算法来实现近乎最优的风险性能,并构建了一个学习问题变化的估计器,通过使用主动学习样本提供一种自适应的样本大小选择规则,以保证足够的时间步数时超额风险是有界的。
May, 2018
本文介绍一种名为 “学习教学” 的方法,它利用两个智能代理相互交互:一个学生模型和一个教师模型。教师模型利用学生模型的反馈来优化自己的教学策略,以达到教师和学生的共同进化,并在各种机器学习任务下通过使用深度神经网络等模型来展示这一方法的实用价值。
May, 2018
本文提出了一种更智能的机器教学范式,即一次性机器教学,并建立了可行的映射方法设计最优化(通常为最小)教学集,以便更快地收敛,从而证明了新教学范式的智能性并验证了该策略的有效性。
Dec, 2022