BriefGPT.xyz
Ask
alpha
关键词
optimization hyperparameter
搜索结果 - 1
使用深度 Q-Learning 控制优化超参数
本文介绍了一种新颖的强化学习状态、动作和奖励函数的定义,它允许深度 Q 网络(DQN)学习控制优化超参数。我们使用经验重放的 Q 学习,训练两个 DQN 接受目标函数状态表示作为输入,并输出与学习率调整或保持不变的动作相关的预期折扣回报,即
→
PDF
8 years ago
Prev
Next