advisers | BriefGPT - AI 论文速递

关键词advisers

搜索结果 - 1

KDD在连续任务中利用导师进行领域知识转移
将顾问整合到深度确定性策略梯度（DDPG）算法，以允许将领域知识以预先学习的政策或预定义的关系的形式整合到学习过程中，以加速学习和改善政策。
PDF3 years ago