基于成本的目标识别与深度学习相遇
基于可用线索推断意图的目标识别是一种基本的认知过程,该研究使用贝叶斯框架来探索行动、时间和目标可解性在目标识别中的作用,并通过分析人类对 Sokoban 领域的目标识别问题的回应,发现行动被赋予最重要性,但时间和可解性在某些情况下也影响目标识别,特别是在行动信息不足时。我们利用这些发现开发了一个目标识别模型,与现有算法相比,更接近人类的推断。我们的工作为人类目标识别提供了新的视角,并朝着更像人类的 AI 模型迈出了一步。
Feb, 2024
本研究旨在使机器人能够学习如何按照自然语言指示序列化其动作以执行任务,通过人类伙伴的成功演示。为了达到这个目的,我们引入了一种新颖的神经符号模型 GoalNet,它能够从人类演示和语言任务描述中推断目标谓词的上下文和任务依赖关系,并结合学习和规划以提高在多阶段任务中的决策能力。通过在一个表示语言变化的基准数据集上进行测试,我们证明了 GoalNet 在任务完成率上比现有基于规则的方法有了显著改进(51%)。
May, 2022
本文研究了两种先进的基于计划的计划识别方法在现实环境中的应用。我们发现这些方法在识别人类行为目标时存在困难,因为人类行为通常不是完全理性的。为了克服这个问题,我们提出了一种通过分类方法进行扩展的方法,该方法通过训练观察行为数据,不仅优于完全基于计划的和纯数据驱动的目标识别方法,而且能够更可靠地识别正确目标,特别是当只看到少量观察时,这大大提高了混合目标识别方法在智能辅助系统中的实用性。
Jan, 2023
对话式目标识别框架(Dialogue for Goal Recognition)通过询问关于噪声传感器数据和次优人类行动的澄清问题,使机器人能够纠正其对人类进展的信念,评估了 D4GR 在厨房和堆积领域的性能,结果显示 D4GR 框架在目标准确性方面比 HTN 高出 1%,在计划准确性方面比 HTN 高出 4-2%,比始终询问的预测模型在目标识别和计划识别方面表现更好,且比基线少问了 68% 的问题,文章还在厨房领域展示了一个真实世界机器人情景,验证了 D4GR 在现实环境中改进的计划和目标识别能力。
Oct, 2023
本文提出了一种结合基于模型的强化学习和目标识别的框架,在离线学习和在线推理阶段分别使用 tabular Q-learning 和三种推理度量,以解决目标识别中需要手动设计、在线计算等问题,从而在标准评估环境中实现了最先进的性能,同时在嘈杂环境中也表现出了优异的性能。
Feb, 2022
本文提出了一种基于算子计数框架的方法来有效计算符合观察结果的解,用于解决目标识别任务,并对部分和噪声观测进行估计和满足观测。通过大规模数据集的实证评估,证明了该方法在一致性比率、准确性和分散性等方面优于以往方法,同时为解决目标识别任务的组合优化开辟了新的研究路径。
May, 2019
目标识别是观察者根据感知到的主体代理行为的一系列观察结果来识别与计划相对应的目标的任务。本文设计了一种依赖于操作计数框架的新型识别方法,并提出了新的约束条件,从理论和实证上分析了它们的特性。在理论方面,我们证明了新的约束条件能够提供符合观察结果的计划成本的下界。我们还进行了广泛的实证评估,评估了新约束条件如何改善解决方案的质量,并发现它们在决定哪些目标不太可能是解决方案的一部分方面特别有用。我们的新型识别方法具有两个关键优势:第一,它们利用了新的整数 / 线性规划约束来高效识别目标;第二,我们展示了新的整数 / 线性规划约束如何在部分可观测性和噪声可观测性下提高对目标的识别能力。
Apr, 2024
该论文介绍了一种基于分层方法的导航系统,该系统采用无模型深度学习和基于模型的路径规划来帮助机器人在新环境下到达目标地点,通过预训练的意图网络来进行本地导航和与路径规划器的融合,实现在新环境和目标中的有效泛化。
Oct, 2017
目标识别设计旨在在决策环境中作出有限的修改,以使更容易推测在该环境下行动的代理人的目标。我们通过使用数据驱动的方法和基于梯度的优化框架来对目标识别设计进行优化,以解决现有方法中的计算需求和对代理人决策的假设性限制,从而实现对决策环境的改进。
Apr, 2024