BriefGPT.xyz
Ask
alpha
关键词
structured policies
搜索结果 - 3
ACL
面向多领域和多任务对话的少样本结构化策略学习
本研究旨在探讨使用结构化政策提高在多领域和多任务环境下的强化学习样本效率。作者在测试不同结构化水平时,发现图形神经网络具有优势,且建议未来的研究应聚焦于连接人类数据、模拟器和自动评估器。
PDF
a year ago
多领域任务导向对话的图神经网络策略及模仿学习
本研究使用基于图神经网络的结构化策略及不同程度的模仿学习,来有效地处理多领域对话,结果表明结构化策略优于标准策略。
PDF
2 years ago
针对真实世界灵巧物体操作的结构化策略和策略优化基准测试
本研究旨在解决机器人技术中的熟练操作难题,特别关注于 TriFinger 系统,提出了基于结构化策略的测试基准,包括了经典机器人学和现代策略优化元素,该基准通过仿真和实际系统验证了基线结果,并对核心特点进行了系统的分析。
PDF
3 years ago
Prev
Next