BriefGPT.xyz
Ask
alpha
关键词
control objectives
搜索结果 - 2
强化学习用于具有概率满足保证的时间逻辑控制合成
本研究提出一种基于强化学习的控制策略综合算法,用于最大化满足作为线性时序逻辑公式给出的高级控制目标的概率。该算法将 LTL 规范转换为限制性确定布琦自动机,再与具有不确定工作空间特性、结构和智能体行为的 PL-MDP 合并进行训练,从而生成
→
PDF
5 years ago
粗粒度识别下鲁棒控制的非渐进分析
探讨了在粗略的近似下能够准确构建动态系统模型所需的样本数量与各种控制目标因性能降低而产生的权衡,给出了稳定线性时不变系统的噪声输入 / 输出样本数的上限,证明了这些需求低于先前旨在准确识别动态模型的需求,并阐述了不同物理输入约束如何影响样本
→
PDF
7 years ago
Prev
Next