- VADv2: 基于概率规划的端到端矢量化自动驾驶
通过大规模驾驶示范学习人类驾驶行为模型,提出基于概率规划的 VADv2 端到端驾驶模型,解决不确定性问题,在 CARLA Town05 基准测试中表现优异,在没有基于规则的封装的情况下稳定运行。
- 使用自动概率规划建模室内空间中 COVID-19 的传播
新冠病毒在室内空间传播的概率规划和动态图分析模型,探讨了非药物干预措施对疾病传播的影响和预测。
- 短中期电力需求的遮蔽多步骤概率预测
本研究提出了 Masked Multi-Step Multivariate Probabilistic Forecasting (MMMPF)框架,通过结合过去的时间信息和未来的已知信息来进行概率预测,以训练任何能够生成输出序列的神经网络模 - 具有时态目标部分有序偏好的概率规划
本文研究了具有对时间目标的偏好的随机系统规划,并引入了一种特殊类型的有限状态自动机,它被称为 “喜好自动机”。作者将该自动机转化为被用于概率规划的策略偏好,建立了多目标马尔可夫决策过程并证明了其有效性。
- 利用不完美观察者的近乎必然意图欺骗规划
本文研究了一种涉及意图欺骗的概率规划问题以及如何利用防御者的有限感知模式来实现攻击目标,同时隐藏攻击者的意图,为此我们提出了相应的攻击策略和规划算法,并验证了其正确性和完整性。
- AAAI抽象学习模型规划与可迁移子任务学习
该研究利用一种新的形式结构,提出了一种基于模型的层次强化学习算法,名为 PALM,可学习独立、模块化的转移和奖励模型用于概率规划,并演示了其将规划和执行进行集成,以快速有效地学习抽象、分层模型以及转移至新的相关任务的增强潜力。
- MM通过概率动作语言桥接常识推理和概率规划
本研究介绍了一个统一框架来集成先前的 commonsense reasoning and probabilistic planning(icorpp)框架的推理和计划组件,并扩展了概率动作语言 pBC+ 以表达常识知识,避免手动努力。
- AAAI概率编程实现的概率规划
本文通过概率编程的视角简要介绍了概率规划的概念,着重阐述了 HYPE 和 ALLEGRO 两个系统的特点,强调它们在处理概率规划中复杂建模问题方面的优势,如处理不断扩大和缩小的状态空间,离散和连续的概率分布,以及一阶设置中的非唯一先验分布等 - AAAI行动模式网络:深度学习的广义策略
介绍了 Action Schema Network (ASNet):一种用于学习概率规划问题通用策略的神经网络模型。通过模拟规划问题的关系结构,ASNet 能够采用权重共享方案,使网络能够应用于给定规划域中的任何问题。此外,提出一种平衡探索 - 人机协作适应性的数学模型
本文概述了机器人与人合作的概率规划和博弈论算法的研究,包括不确定性建模和对人类内部状态和变化的推理,以及在多个实际场景下实现的具体行为。
- AAAI一种基于符号 SAT 的 POMDP 几乎必达性小策略算法
研究 POMDPs 的几乎确定可达性问题,提出了具有小内存的策略的符号算法,通过有效编码到 SAT 并使用 SAT solver 来解决问题。
- 基于启发式正向搜索和加权模型计数的概率规划
提出了一种名为 Probabilistic-FF 的新的概率规划算法,该算法结合了 Conformant-FF 的技术和加权模型计数技术,可在具有概率部分不可观测性的问题上进行推理,并在各种概率域中显示出良好的可扩展性。
- 概率规划的计算复杂度
研究了具有平面和命题表示的概率规划领域中测试和寻找小规划的计算复杂性,发现问题的复杂性分别属于 PL,P,NP,co-NP,PP,NP^PP,co-NP^PP 和 PSPACE,提出了一个新的基本 NP^PP 完全问题 E-MAJSAT,表