面向一般行为代理的基于数据驱动的目标识别设计
本文研究了两种先进的基于计划的计划识别方法在现实环境中的应用。我们发现这些方法在识别人类行为目标时存在困难,因为人类行为通常不是完全理性的。为了克服这个问题,我们提出了一种通过分类方法进行扩展的方法,该方法通过训练观察行为数据,不仅优于完全基于计划的和纯数据驱动的目标识别方法,而且能够更可靠地识别正确目标,特别是当只看到少量观察时,这大大提高了混合目标识别方法在智能辅助系统中的实用性。
Jan, 2023
本文提出了一种结合基于模型的强化学习和目标识别的框架,在离线学习和在线推理阶段分别使用 tabular Q-learning 和三种推理度量,以解决目标识别中需要手动设计、在线计算等问题,从而在标准评估环境中实现了最先进的性能,同时在嘈杂环境中也表现出了优异的性能。
Feb, 2022
本文提出了一种基于算子计数框架的方法来有效计算符合观察结果的解,用于解决目标识别任务,并对部分和噪声观测进行估计和满足观测。通过大规模数据集的实证评估,证明了该方法在一致性比率、准确性和分散性等方面优于以往方法,同时为解决目标识别任务的组合优化开辟了新的研究路径。
May, 2019
采用一种基于强化学习实现的框架,实现了自动对序列数据进行目标驱动的数据抽象。该框架在不受数据输入顺序限制的同时,还可以定义不同的目标,以便以最好的方式保留输入数据的不同方面,能够在涉及手稿、视频和文本数据的情况下实现最佳抽象结果。
Jul, 2019
该研究使用证据权值框架介绍和评估可解释性目标识别模型,提供人性化的解释并研究了不同场景下其表现,并通过人类行为研究和 Sokoban 游戏研究证明该模型可以成功生成人类模拟的解释,并调查观察者在接受解释后对任务预测、解释满意度和信任的理解。
Mar, 2023
目标识别是观察者根据感知到的主体代理行为的一系列观察结果来识别与计划相对应的目标的任务。本文设计了一种依赖于操作计数框架的新型识别方法,并提出了新的约束条件,从理论和实证上分析了它们的特性。在理论方面,我们证明了新的约束条件能够提供符合观察结果的计划成本的下界。我们还进行了广泛的实证评估,评估了新约束条件如何改善解决方案的质量,并发现它们在决定哪些目标不太可能是解决方案的一部分方面特别有用。我们的新型识别方法具有两个关键优势:第一,它们利用了新的整数 / 线性规划约束来高效识别目标;第二,我们展示了新的整数 / 线性规划约束如何在部分可观测性和噪声可观测性下提高对目标的识别能力。
Apr, 2024
本文提出了一种在线目标识别混合方法,结合了符号规划和数据驱动方法, 并在真实世界的烹饪场景中进行了评估,研究结果表明,与现有技术相比该方法在计算时间上更高效,同时也提高了目标识别的性能。另外,论文也证明了该方法适用于真实世界的场景。
Jan, 2023
本文研究将目标识别扩展到具有完整可观察性和非确定性的计划领域模型中,重点是在使用线性时间逻辑(LTLf)和纯过去线性时间逻辑(PLTLf)表达的有限痕迹上识别目标。我们开发了第一种能够识别此类设置中目标的方法,并使用六个计划领域模型上的不同 LTLf 和 PLTLf 目标进行评估,实验结果表明我们的方法在不同的识别设置中识别时间上延长的目标是准确的。
Jun, 2023