面向一般行为代理的基于数据驱动的目标识别设计

Apr, 2024

面向一般行为代理的基于数据驱动的目标识别设计

Data-Driven Goal Recognition Design for General Behavioral Agents

Robert Kasumba, Guanghui Yu, Chien-Ju Ho, Sarah Keren, William Yeoh

TL;DR目标识别设计旨在在决策环境中作出有限的修改，以使更容易推测在该环境下行动的代理人的目标。我们通过使用数据驱动的方法和基于梯度的优化框架来对目标识别设计进行优化，以解决现有方法中的计算需求和对代理人决策的假设性限制，从而实现对决策环境的改进。

Abstract

goal recognition design aims to make limited modifications to decision-making environments with the goal of making it easier to infer the goals of agents acting within those environments. Although various research efforts have been made in →

goal recognition design data-driven approach machine learning model gradient-based optimization framework enhanced goal recognition

发现论文，激发创造

探索基于规划和数据驱动方法相结合的目标识别

本文研究了两种先进的基于计划的计划识别方法在现实环境中的应用。我们发现这些方法在识别人类行为目标时存在困难，因为人类行为通常不是完全理性的。为了克服这个问题，我们提出了一种通过分类方法进行扩展的方法，该方法通过训练观察行为数据，不仅优于完全基于计划的和纯数据驱动的目标识别方法，而且能够更可靠地识别正确目标，特别是当只看到少量观察时，这大大提高了混合目标识别方法在智能辅助系统中的实用性。

Jan, 2023

目标识别作为强化学习

本文提出了一种结合基于模型的强化学习和目标识别的框架，在离线学习和在线推理阶段分别使用 tabular Q-learning 和三种推理度量，以解决目标识别中需要手动设计、在线计算等问题，从而在标准评估环境中实现了最先进的性能，同时在嘈杂环境中也表现出了优异的性能。

Feb, 2022

基于线性规划的目标识别规划方法

本文提出了一种基于算子计数框架的方法来有效计算符合观察结果的解，用于解决目标识别任务，并对部分和噪声观测进行估计和满足观测。通过大规模数据集的实证评估，证明了该方法在一致性比率、准确性和分散性等方面优于以往方法，同时为解决目标识别任务的组合优化开辟了新的研究路径。

May, 2019

基于成本的目标识别与深度学习相遇

本文探讨了使用深度学习的深度神经网络在目标预测方面的性能，证明了该方法在解决各种领域的意图识别和目标预测中具有更好的准确性和时效性。

Nov, 2019

深度学习任务中的目标识别：GRNet 方法

研究使用机器学习将目标识别问题转化为分类任务，利用循环神经网络预测代理目标，并在性能上优于现有方法。

Oct, 2022

目标驱动的序列数据抽象

采用一种基于强化学习实现的框架，实现了自动对序列数据进行目标驱动的数据抽象。该框架在不受数据输入顺序限制的同时，还可以定义不同的目标，以便以最好的方式保留输入数据的不同方面，能够在涉及手稿、视频和文本数据的情况下实现最佳抽象结果。

Jul, 2019

基于证据权重的可解释目标识别框架

该研究使用证据权值框架介绍和评估可解释性目标识别模型，提供人性化的解释并研究了不同场景下其表现，并通过人类行为研究和 Sokoban 游戏研究证明该模型可以成功生成人类模拟的解释，并调查观察者在接受解释后对任务预测、解释满意度和信任的理解。

Mar, 2023

线性规划通过目标识别

目标识别是观察者根据感知到的主体代理行为的一系列观察结果来识别与计划相对应的目标的任务。本文设计了一种依赖于操作计数框架的新型识别方法，并提出了新的约束条件，从理论和实证上分析了它们的特性。在理论方面，我们证明了新的约束条件能够提供符合观察结果的计划成本的下界。我们还进行了广泛的实证评估，评估了新约束条件如何改善解决方案的质量，并发现它们在决定哪些目标不太可能是解决方案的一部分方面特别有用。我们的新型识别方法具有两个关键优势：第一，它们利用了新的整数 / 线性规划约束来高效识别目标；第二，我们展示了新的整数 / 线性规划约束如何在部分可观测性和噪声可观测性下提高对目标的识别能力。

Apr, 2024

利用规划里程碑进行混合在线目标识别

本文提出了一种在线目标识别混合方法，结合了符号规划和数据驱动方法，并在真实世界的烹饪场景中进行了评估，研究结果表明，与现有技术相比该方法在计算时间上更高效，同时也提高了目标识别的性能。另外，论文也证明了该方法适用于真实世界的场景。

Jan, 2023

完全可观察非确定性领域模型中的时间扩展目标识别

本文研究将目标识别扩展到具有完整可观察性和非确定性的计划领域模型中，重点是在使用线性时间逻辑（LTLf）和纯过去线性时间逻辑（PLTLf）表达的有限痕迹上识别目标。我们开发了第一种能够识别此类设置中目标的方法，并使用六个计划领域模型上的不同 LTLf 和 PLTLf 目标进行评估，实验结果表明我们的方法在不同的识别设置中识别时间上延长的目标是准确的。

Jun, 2023