BriefGPT.xyz
大模型
Ask
alpha
关键词
actor-critic approach
搜索结果 - 4
使用深度强化学习进行 X 射线 CT 的序列实验设计
采用深度强化学习方法解决了优化实验设计问题,以选择最具信息量的扫描角度,从而在 CT 中实现少角度成像。
PDF
a year ago
EMNLP
通过知识选择改进预训练语言模型的知识蒸馏
本文提出了一种基于演员 - 评论家方法的知识蒸馏框架,旨在从教师模型中选择适当的知识来训练学生模型,实验结果表明该方法在 GLUE 数据集上优于常规基线模型。
PDF
a year ago
均场多智体强化学习:一种分散网络方法
提出了基于 LTDE-Neural-AC 和演员 - 评论家方法的多智能体强化学习算法,应用于自驾车、拼车、数据和交通路由模型的图网络,其解决了分散式多智能体强化学习网络结构的问题,并具有收敛保证的优势。
PDF
3 years ago
群体系统的引导深度强化学习
本文研究了如何使用有限的传感能力控制一组合作智能体,使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估,评估了在寻找和维持距离和定位目标方面的性能。
PDF
7 years ago
Prev
Next