通过将规划器使用的一阶符号表示从编码状态空间结构的非符号输入中学习,我们解决了图像与符号之间的鸿沟,这意味着推断一个完整的一阶表示(即一般的动作模式、关系符号和对象)来解释所观察到的状态空间结构。
Sep, 2019
本文介绍了一种基于对象导向表现形式的迁移学习框架,该框架利用人类学习因果模型并将其用于环境的变量之间的迁移。作者将连续优化的结构学习技术应用于对象之间的因果关系的显式学习中,并通过基于因果知识的对象分类将其迁移到目标领域。最后,在强化学习中,作者结合了因果模型和无模型方法,实现对格子世界环境中的对象表现的优化。
Jul, 2020
本文研究了大型语言模型在生成因果图方面的能力,通过将条件独立性查询作为 LLM 的提示并与 PC 算法的答案结合,提出了一种基于统计启发的投票模式来改善性能,并发现因果推理可以用于对概率查询进行合理解释,从而证明了基于知识的因果推理可能成为一种补充数据驱动因果发现的工具。
Jun, 2024
本文研究了关于基于数据学习因果模型的结构学习算法,比较了它们在不同场景下的实验性能表现。
Jun, 2017
本文提出了基于范畴论概念的 C - 集合和双推出重写 (DPO) 的计划表示的一种替代方法,其可以有效处理支持所有层次域抽象的关于世界状态的结构化知识,提供了使用知识图谱和关系型数据库对世界状态和计划更新建模的形式语义,相较于经典规划表示,在处理隐含前提和效果上具有优越性,提供了一种更有结构的框架来建模和解决规划问题。
May, 2023
本文提出了一种基于贝叶斯推理的方法,在低级别数据的情况下学习维度高、SCM 结构和参数未知的高级因果变量,从而实现对潜在 SCM 的推断和图像生成。
Oct, 2022
本文研究如何利用专家知识来改进因果图的数据驱动识别,通过考虑提出一些修正策略来利用因果图的一致性属性,例如无环性和条件独立性。最后,通过一个真实数据的案例分析,本文说明了一个大型语言模型可以被用作一个不完善的专家。
Jul, 2023
本研究提出了一种新的学习规划模型的方法,其既有组合方法学习清晰的动作模板,又能够从图像空间中产生动作模板,这是结合前两种方法的优势的一步。
Apr, 2022
通过学习具有因果模型语义的潜在变量表示形式,此研究论文探讨了因果模型在人工智能中的应用和理论基础,重点关注可辨识性问题以及在无直接监督下的表示学习目标可行性。
本文研究在机器学习中从观察数据中识别因果关系的问题,探讨如何帮助学习高级变量及其中的因果结构,并介绍了一套基于强化学习的环境用于测试表示学习算法的性能。研究表明,模型中显式地融合结构和模块化有助于因果识别。
Jul, 2021