BriefGPT.xyz
Ask
alpha
关键词
human guidance
搜索结果 - 3
意见引导的强化学习
人类导引在强化学习中经常被用来提升学习代理的性能。然而,人类的见解通常只是意见和猜测,而不是明确的论证。尽管意见存在不确定性,但它们往往比硬证据早出现。因此,通过意见来引导强化学习代理提供了更有效的学习过程的潜力,但也面临以形式化方式建模和
→
PDF
a month ago
利用人类辅助完成顺序决策任务的最新进展
本文综述了五种最近主要依赖于人类指导的机器学习框架及其动机,假设和实施,并讨论可能的未来研究方向。
PDF
3 years ago
IJCAI
利用人类指导提升深度强化学习任务
本文综述了五个最近的学习框架,这些框架主要依赖人类指导,而不是传统的一步一步的动作演示,评估了每个框架的动机、假设和实现,并讨论了可能的未来研究方向。
PDF
5 years ago
Prev
Next