- 带有条件效果的 PDDL 领域的安全学习 -- 扩展版本
通过学习条件效应,我们提出了能够解决规划问题的第一个算法 ——SAM Learning of Conditional Effects (Conditional-SAM)。实验结果表明,Conditional-SAM 学习到的行动模型可以在大 - 从状态轨迹中学习规划行动模型
通过学习状态轨迹开始,本文探索了在未提供学习动作参数时的学习情况,定义了两个追踪质量级别,并提出了相应的算法。实验评估表明,提出的算法相对于现有的学习工具 FAMA,速度更快,可以处理更大的输入,并提供更接近参考模型的学习动作模型。
- Vamos: 视频理解的多功能行为模型
在研究中,我们提出了一种基于大型语言模型的学习框架,使用视频中提取的动作标签和自由形式的描述作为输入,证明了基于文本的视频表示在语言模型时代具有竞争力的表现,并在多个基准测试中取得了最先进的性能。
- 从叙事文本中自动获取行为模型
通过预测常识事件关系以及文本中的矛盾和相似之处,NaRuto 以无监督的方式从叙事文本中提取结构化事件,并生成基于计划语言风格的动作模型,实验结果显示在经典叙事规划领域中,NaRuto 能够生成比现有的全自动方法质量更好的动作模型,甚至与半 - 线上建模用于离线规划的立场文件
AI 规划研究中,规划问题的定义和表达是关键。文章建议改变规划流程,采用在线建模与离线规划的方式,以更好地适应现实需求,并提出了一个基于动作成本估计的具体实现方法。
- 计划中基于文本的动作模型获取
本论文提出了一种利用自然语言处理和约束满足技术从文本描述中学习行动模型的方法,通过构建一种新型语言模型提取计划轨迹并建立一组约束条件来生成行动模型。实验结果表明这种方法是有效而高效的。
- AAAISTRIPS 行动发现
本文提出一种新算法来无监督地合成 STRIPS 动作模型,并通过多种实验表明所学习的动作模型可以泛化到未见过的规划实例。
- 从无序和嘈杂计划痕迹中学习动作模型
本文提出了一种基于 MAX-SAT 框架的方法,用于自动学习规划系统的领域模型,通过输入一组含有无序动作和噪声的计划迹线来输出最佳的动作模型,并通过系统实证评估证明了该方法的有效性
- 基于语言文本的弱监督动作学习
本文提出了一种基于弱监督学习的人类行为学习方法,通过视频的文字形式来推断其中涉及的行为,并能在没有帧级别标注的情况下学习相关的行为模型;该方法在四个活动数据集上进行了评估,证明了其高效性和竞争力。
- 学习部分可观察的确定性动作模型
研究了如何在动态部分可观测领域中识别确定性动作效果和先决条件,并提出了可行的算法来解决这个问题。