Nov, 2022

PARTNR: 基于可信互动学习的取放模糊性解决方案

TL;DRPARTNR算法通过多模式分析检测训练策略中的不确定性,提出自适应门控函数来决定是否需要额外用户演示,并利用聚合到数据集中的演示信息进行训练,使策略能够迅速适应领域转换,最大程度地减少所需演示数量并自主执行。