neural network policy | BriefGPT

关键词neural network policy

搜索结果 - 4

基于潜空间目标的最优控制的深度强化学习行为模式切换
利用最优控制在深度强化学习策略的潜在空间中进行优化，识别并切换行为模式，结果表明该方法能够使策略产生所需的行为模式。
PDFa month ago
深强化学习交易代理的灰盒对抗攻击
通过在同一股票市场进行交易，该研究展示了利用混合深度神经网络作为策略的对抗智能代理能够对深度强化学习交易代理进行攻击，并且能够显著降低其奖励值，从而大幅减少基线系统、集成方法、以及工业合作伙伴开发的自动交易软件的潜在利润。
PDF9 months ago
基于视觉的自主无人机赛车的深度感觉运动策略学习
通过学习深度的感知动作策略，使用对比学习从输入图像中提取固定特征表示，通过两阶段的作弊式学习框架训练神经网络策略，将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断，无需全局一致的状态估计、轨迹规划和手工控制设计。
PDF2 years ago
学习四肢机器人灵活动态技能
通过在仿真中训练神经网络策略并将其转移到现实的四足动态平衡系统，研究创造了一种快速、自动且高效的数据生成方案，从而实现了在四足机器人技能方面的进一步提升。
PDF5 years ago