- 从分类的角度编码智能
编码和智能密切相关,基于类别论的视角提出了 “编码为智能” 问题,并推导了一个通用框架来理解现有方法。该框架帮助识别解决多任务/应用的最小描述长度(MDL)优化问题的挑战和关键元素,提供了构建更智能系统的机会。通过系统回顾最近在数据、模型和 - 知识链:通过从知识图谱中学习将知识推理整合到大规模语言模型中
通过构建自然语言处理任务中的大型语言模型,研究了知识推理的细节和方法,并提出了一个全面的知识推理框架 Chain-of-Knowledge(CoK),通过基于知识图的规则挖掘生成数据集,并结合人类知识探索过程的试错机制来提高模型学习的效果。 - 基于可微粒子滤波器的正规化流
该研究使用 (条件) 归一化流构建动态模型、提议分布和测量模型,提出了一种不同 iable 粒子滤波框架,并通过一系列数值实验评估了该方法的性能。
- 非稳态环境中的广泛计划与学习的认知性探索
该论文介绍了一种在使用关系表示表示的非平稳随机环境中进行持续规划和模型学习的新方法。
- 基于稀疏神经动力学的模型控制
使用深度神经网络从观测中学习预测模型是解决现实世界规划和控制问题的一种有前景的新方法。本文提出了一个新的集成模型学习和预测控制框架,通过逐渐稀疏化神经网络以有效优化算法进行端到端的优化,从而在保证预测准确性的基础上取得更好的闭环控制性能。
- 视觉语言辅助属性学习
本文提出了一种利用可用的视觉 - 语言知识来改进模型学习的方法,通过一个现成的视觉 - 语言模型辅助,预测每个缺失的属性标签的可能性,在训练中选择忽略那些得分较高的标签,该方法在对新整理的 VAW 数据集上实现了最先进的性能,定性评估证明了 - KEEC: 嵌入式控制的等变几何
该论文研究了表示学习如何在未知和复杂的动态系统中实现最优控制,尤其是在混沌和非线性系统中,而不依赖于先前对系统动态的领域知识。研究提出了一种与动力系统相关的等变几何的核心思想,在这个对应的几何空间内进行最优控制,通过学习、嵌入轨迹和利用微分 - 如何微调模型:统一模型偏移与模型偏差策略优化
设计和推导出具有性能提升保证的高效的基于模型的强化学习算法具有挑战性,主要原因是模型学习和策略优化之间的高耦合。在本文中,我们理论上推导了一种优化目标,能够统一模型漂移和模型偏差,并制定了一种微调过程。该过程自适应地调整模型更新,以获得性能 - 主动推断中的高效计算
该论文提出了一种新的规划算法,通过动态规划算法实现了计算效率的大幅提升,并且简化了目标分布的制定,同时在不确定的条件下获得了准确的模型学习和规划。
- PDSketch:一体化的计划域编程与学习
本文研究了一种模型学习和在线规划方法,目的是构建灵活、通用的机器人。具体而言,我们研究如何利用底层环境转换模型中的局部性和稀疏性结构,以提高模型泛化能力、数据效率和运行效率。我们提出了一种新的领域定义语言 PDSketch,允许用户灵活定义 - EMNLP面向数学题的结构统一 M 树编码求解器
本文提出了一种基于 M-tree 的求解数学问题的方法 SUMC-Solver,相比现有方法在同等设置下表现更好,在低资源条件下表现更佳。
- AAAI仅从正例学习可解释的时间属性
本文探讨黑盒系统建模中使用有限状态自动机和线性时态逻辑公式的方法,通过正例学习建立有意义的、最小化的模型。作者提出了符号方法和反例引导方法两种学习方式,并在合成数据上进行评估。
- 基于时序差分学习的模型预测控制
本文提出了一种称之为 TD-MPC 的新型控制方法,该方法结合了基于模型和基于模型无关的方法。研究结果表明,该方法能够在 DMControl 和 Meta-World 上取得更好的样本效率和渐进性能。
- 去偏见化后门攻击:利用后门攻击消除数据偏见
本文研究了一种新的 AI 安全风险 —— 后门攻击,并提出 Debiasing Backdoor Attack (DBA) 来解决数据去偏差问题,该方法在去偏差任务中取得了最先进的结果,适用范围比欠采样更广。
- ICML变分退火重要性采样的替代似然函数
我们提出了一种可以与其他变分参数一起学习的代理似然函数,以此支持两种算法类别优势的组合,此算法允许用户在推理保真度和计算成本之间进行直观权衡,适用于概率编程框架中黑盒子推理。
- ICCV行人属性识别的空间和语义一致性规则化
本文提出了一个基于空间和语义一致性框架的人行属性识别模型,通过空间统一和语义特征提取实现了属性的跨图片一致性。实验表明,该方法在 PA100K、RAP 和 PETA 等基准测试中表现出色,同时不增加参数。
- MM一种用于在线增量学习语义分割的 EM 框架
本文提出了一种基于期望最大化 (EM) 框架的增量学习策略,用于快速适应深度分割模型的新类别,具有更好的效果和稳定性,并应用于 PASCAL VOC 2012 和 ADE20K 数据集上进行验证。
- Muesli: 综合政策优化的改进
该论文提出一种新的政策更新方式 Muesli,它将正则化策略优化与模型学习结合作为辅助损失函数。该方法在 Atari 上取得了与 MuZero 相媲美的性能,而没有使用深度搜索。同时其计算速度与基线模型相当,并在连续控制和 9x9 围棋等领 - ICML切片 Stein 差异的活跃切片
提出使用有限随机切片方向来放宽核化 Sliced Stein 差异 (SSD) 的最优切片方向需求,并通过构造主动子空间和谱分解方法找到好的切片方向,从而达到了优于传统梯度下降方法 14-80 倍的拟合度和模型学习性能。
- 基于模型的强化学习中的价值等价原则
本文探讨强化学习中的值等价性原则,提出基于值等价性原则的模型学习问题,证明了随着政策和函数集的扩大,价值等价模型的类别将收缩到描述环境的完美模型上,并通过实验验证了该价值等价模型学习方法的优越性及其在最大似然估计等传统模型学习算法中的实用意