关键词realizability assumption
搜索结果 - 2
- 可扩展弱标注主动学习的改进自适应算法
文章提出了一种名为 WL-AC 的新型算法模板,该模板可以利用低质量的弱标注器来减少查询复杂性,同时保持所需的准确度水平。通过绕过实现假设,WL-AC 适用于许多现实世界的情况,包括随机损坏的弱标签和高维度家族的区别分类器。在经验上,我们提 - 可预测奖励的情境决策学习
本研究探讨了一种基于可实现性假设下的上下文强化学习问题,并提出了一种新算法 —— 回归器消除,证明了其在保证可实现性前提下,也具有与不可实现性假设情况相似的遗憾率;同时在任意一组策略的情况下,我们证明了本算法具有恒定遗憾,相对于之前的方法而