BriefGPT.xyz
Ask
alpha
关键词
model-based offline quantum reinforcement learning
搜索结果 - 1
基于模型的离线量子强化学习
这篇论文提出了第一种基于模型的离线量子强化学习算法,并在滑车杆平衡问题上展示了其功能。模型和待优化的策略都以变分量子电路的形式实现。通过梯度下降,模型被训练以拟合预先记录的数据集。策略使用无梯度优化方案,以模型给出的回报估计作为适应度函数进
→
PDF
3 months ago
Prev
Next