关键词imitation learning framework
搜索结果 - 3
- Yordle: 分支定界高效模仿学习
本文介绍了在 2021 年 NeurIPS 机器学习求解组合优化问题比赛中,qqy 团队的胜出方案 Yordle。该方案是一种高效的模仿学习框架,用于改进分支定界算法的性能,并通过数据采样和筛选提高准确率。在实验中,Yordle 的性能显著 - ACL非自回归神经机器翻译的模仿学习
本文提出了基于仿真学习的非自回归机器翻译框架,该框架仍然具有快速翻译速度但与其自回归对应方法相比具有可比较的翻译性能。通过对 IWSLT16、WMT14 和 WMT16 数据集进行实验,发现我们提出的模型在保持翻译质量可比的同时,比自回归模 - 通过模仿学习信息聚集
本篇论文研究的是一个应用于移动机器人自主探索和检查的问题,即在燃料预算有限的情况下最大化从世界中获取的信息量的问题。作者提出了一种新颖的数据驱动的模仿学习框架,并通过 EXPLORE 算法来训练一个策略以模仿一个有完整信息并计算非简约解来最