在机器教学中操纵离散输入的预测
本文探讨了机器教学的问题,提出了基于马尔可夫决策过程的序列教学问题。通过研究多臂老虎机学习器的模拟实验和用户研究,探究了教学规划和学习者具有教师模型两种方法对于学习效果的影响,分别从学习者的角度和教师的角度考虑互动智能系统的策略行为,提供了新的研究方法。
Sep, 2018
本研究提出了一种新的稳健性估计器,以避免在透明决策规则下个体的行为可能造成的操纵行为对决策结果的影响并在肯尼亚的一项大型实验中表明,在策略鲁棒方法估计的决策规则的指导下,其表现优于基于标准监督学习方法的规则。
Apr, 2020
该研究针对离散输入空间(即有限样本池)限制了老师的能力,提出一种基于连续输入空间的数据幻觉教学方法,即 DHT,可根据标签、学习者的状态和目标概念智能生成输入数据,实现迭代式机器教学。在多种教学设置下进行了广泛的实证研究,证实了 DHT 的有效性。
Oct, 2022
本文探讨了机器教学的逆问题,提出了一种新的范例,即学习者使用迭代算法,教师可以根据学习者当前的表现顺序地、智能地提供示例。它着重于实现学习者模型的快速收敛,可以通过设计教学算法减少教学示例并比没有教师进行教学的学习实现更快的收敛。
May, 2017
本研究探讨在算法交易系统中,使用对抗性学习技术对输入数据流进行实时操纵的攻击,并评估其在现实市场数据流上的有效性和在白盒和黑盒设置中的影响。我们提出了各种缓解方法并讨论其限制,旨在提醒金融界对自动化学习模型使用所带来的潜在风险,并促进进一步研究。
Oct, 2020
该研究探讨了在机器教学中教师如何在交互诊断和教学之前使用高斯过程推断学生相关信息的问题,并应用该算法到学生学习算法参数的推断和避免学生重复轨迹的离线强化学习中,并说明了交互教学比被动学习更可取的场景。
Apr, 2022
本文通过差分方程和随机微积分的连续时间分析视角,研究离散时间问题,提出了一个连续时间、无需参数算法,并开发了一个类似的离散算法,最后提出了一个任意时间的算法以应对最难情况,并给出了一些令人满意的实验证据。
Jun, 2022