BriefGPT.xyz
Ask
alpha
关键词
continuous spaces
搜索结果 - 4
极值寻求动作选择以加速策略优化
通过引入基于极值搜索控制的自适应控制步骤,改进了模型自由强化学习中的动作选择,在标准策略优化中提高了学习效率。
PDF
3 months ago
AAAI
本地内在维度熵
本文探讨基于数据维度和结构本身而非基于统计的方法,提出一种计算连续空间熵的测度,称作 ID-Entropy,该熵测度适合在神经网络中广泛使用,可以保留数据固有的维度信息,并在分类器和自动编码器中直接控制泛化差距的大小。
PDF
a year ago
具函数噪声的连续状态空间中保护隐私的 Q 学习
通过在训练中迭代地向价值函数添加函数噪声,本文在连续空间中考虑了保护差分隐私强化学习算法的价值函数逼近器,并证明了其隐私保证和近似最优性。
PDF
5 years ago
连续领域中的启发式在线目标识别
本文提出一种基于规划的计划识别方法,能够在线识别目标以及适用于连续空间,使用两个启发式决策点和连续环境的启发式策略来提高运行时效率。
PDF
7 years ago
Prev
Next