BriefGPT.xyz
大模型
Ask
alpha
关键词
deep q network
搜索结果 - 5
PDRL:基于多智能体强化学习的预测性监控
提出了一种新颖且通用的预测深度强化学习(PDRL)系统,用于监测复杂环境中的未来状态,并在时间序列预测过程中取得了最先进的性能。
PDF
9 months ago
人工智能生成内容(AIGC)的语义通信:朝着有效内容创作迈进
通过引入内容生成层,将人工智能生成内容 (AIGC) 与语义通讯 (SemCom) 结合起来,提供了清晰的 AIGC 与 SemCom 之间互动产生有意义和有效内容的概念模型,并提出了一种基于 AIGC 技术的语义信息编码器和解码器的新框架
→
PDF
a year ago
具有信息增强状态编码器的分级 Q 强化学习在层次化协作多车追逐中的应用
本文提出了一种基于分级协同增强的强化学习框架(GQRL-IESE)来解决复杂的城市交通环境下的分层多车追逐问题,实验证明该框架的效率比其他方法平均快了 47.64%以上。
PDF
2 years ago
AAAI
自我校正 Q-Learning
本文介绍了一种新的自我校正 Q 学习算法,其通过平衡常规 Q-learning 中使用的单估计器的过高估计和 Double Q-learning 中使用的双估计器的低估计来解决最大化偏差问题,并提出了应用于 Deep Q Network 的
→
PDF
4 years ago
NIPS
变分深度 Q 网络
本文提出一种框架,通过利用强大的变分推断子程序来直接处理深度 Q 网络(DQN)中值函数参数的概率分布,建立了我们提出的代理目标与变分推断损失之间的等价关系,并在大规模链式马尔科夫决策过程(MDP)上实现了高效的探索和表现。
PDF
7 years ago
Prev
Next