基于向量表示的离散和连续域在线目标识别
本文提出了一种在线目标识别混合方法,结合了符号规划和数据驱动方法, 并在真实世界的烹饪场景中进行了评估,研究结果表明,与现有技术相比该方法在计算时间上更高效,同时也提高了目标识别的性能。另外,论文也证明了该方法适用于真实世界的场景。
Jan, 2023
本文提出了一种结合基于模型的强化学习和目标识别的框架,在离线学习和在线推理阶段分别使用 tabular Q-learning 和三种推理度量,以解决目标识别中需要手动设计、在线计算等问题,从而在标准评估环境中实现了最先进的性能,同时在嘈杂环境中也表现出了优异的性能。
Feb, 2022
本文研究将目标识别扩展到具有完整可观察性和非确定性的计划领域模型中,重点是在使用线性时间逻辑(LTLf)和纯过去线性时间逻辑(PLTLf)表达的有限痕迹上识别目标。我们开发了第一种能够识别此类设置中目标的方法,并使用六个计划领域模型上的不同 LTLf 和 PLTLf 目标进行评估,实验结果表明我们的方法在不同的识别设置中识别时间上延长的目标是准确的。
Jun, 2023
本文提出了一种基于算子计数框架的方法来有效计算符合观察结果的解,用于解决目标识别任务,并对部分和噪声观测进行估计和满足观测。通过大规模数据集的实证评估,证明了该方法在一致性比率、准确性和分散性等方面优于以往方法,同时为解决目标识别任务的组合优化开辟了新的研究路径。
May, 2019
本文提出了一个在线计划和执行系统,使用混合置信状态空间进行确定性代价敏感计划来选择成功概率高的观察行动和连续控制行动,以解决部分可观察问题,并在模拟和真实世界的厨房中展示了高效的解决方案。
Nov, 2019
目标识别是观察者根据感知到的主体代理行为的一系列观察结果来识别与计划相对应的目标的任务。本文设计了一种依赖于操作计数框架的新型识别方法,并提出了新的约束条件,从理论和实证上分析了它们的特性。在理论方面,我们证明了新的约束条件能够提供符合观察结果的计划成本的下界。我们还进行了广泛的实证评估,评估了新约束条件如何改善解决方案的质量,并发现它们在决定哪些目标不太可能是解决方案的一部分方面特别有用。我们的新型识别方法具有两个关键优势:第一,它们利用了新的整数 / 线性规划约束来高效识别目标;第二,我们展示了新的整数 / 线性规划约束如何在部分可观测性和噪声可观测性下提高对目标的识别能力。
Apr, 2024
本文研究了两种先进的基于计划的计划识别方法在现实环境中的应用。我们发现这些方法在识别人类行为目标时存在困难,因为人类行为通常不是完全理性的。为了克服这个问题,我们提出了一种通过分类方法进行扩展的方法,该方法通过训练观察行为数据,不仅优于完全基于计划的和纯数据驱动的目标识别方法,而且能够更可靠地识别正确目标,特别是当只看到少量观察时,这大大提高了混合目标识别方法在智能辅助系统中的实用性。
Jan, 2023
本研究提出 Goal and Occluded Factor Inference (GOFI) 算法,在自动驾驶场景下应用逆向规划技术共同推断目标和潜在的遮挡因素的概率信念,并将这些信念集成到蒙特卡罗树搜索(MCTS)中,从而更准确地预测其他智能体的行为并避免碰撞等风险。
Aug, 2021