元世界条件神经过程

Feb, 2023

Meta-World Conditional Neural Processes

Suzan Ece Ada, Emre Ugur

TL;DR提出了 Meta-World 条件神经过程（MW-CNP），是一种使用条件神经过程的条件世界模型生成器，使得代理可以从其自身 “幻想” 中采样，以尽可能减少测试时与目标环境的交互，并通过生成的 “幻觉” 让代理与任务适应，以显著减少与基线相比从目标环境中收集的样本数量。

Abstract

We propose meta-world conditional neural processes (MW-CNP), a conditional world model generator that leverages sample efficiency and scal

meta-world conditional neural processes sample efficiency few-shot learning meta-rl

发现论文，激发创造

证据性条件神经过程

Evidential Conditional Neural Processes proposes a hierarchical Bayesian structure for the uncertainty decomposition in few-shot learning tasks to achieve robustness on noisy training tasks and extensive experiments demonstrate its effectiveness.

Nov, 2022

世界模型

本研究旨在使用生成神经网络建立流行的强化学习环境下的世界模型，并利用该世界模型进行无监督学习，学习环境的空间和时间紧凑表示。通过使用从世界模型提取的特征作为代理输入，我们可以训练出非常紧凑和简单的策略来解决所需任务。我们甚至可以在代理自己的幻象梦境中完全进行训练，并将该策略传输回实际环境中。

Mar, 2018

关系条件神经过程通过实用等变性实现

本研究提出关系条件神经过程（RCNPs），旨在将等变性巧妙地整合到神经过程模型中，从而提升了其在高维度数据下的适用性和影响力，并在大量自然包含等变性的任务上展示了 RCNPs 的高竞争性能。

Jun, 2023

卷积条件神经过程

本研究介绍了卷积条件神经过程 (ConvCNP)，它是神经过程家族中的新成员，能够建模数据中的平移等变性。研究表明，加入平移等变性的建模有助于更好地处理时间序列、空间数据和图像，而且卷积深度集能够实现任何平移等变嵌入。研究还证明，ConvCNP 在多个设置中取得了良好的性能，并且能够在挑战性的任务中实现零样本泛化。

Oct, 2019

光谱卷积有条件神经过程

基于神经网络将概率模型参数化的条件神经过程（CNP）能够提供良好校准的预测，特别适用于元学习问题。SConvCNPs 是 NPs 家族的新成员，通过在频域更有效地表示函数，克服了 ConvCNP 在处理有限和不规则采样的数据时捕捉长程依赖和复杂模式的挑战。

Apr, 2024

带有世界知识模型的 Agent 规划

使用大型语言模型作为代理模型来执行交互式规划任务已取得令人称赞的结果。本文引入了参数化的世界知识模型（WKM）来促进代理规划，通过从专家和采样轨迹中自我合成知识，并提供全局任务知识和动态状态知识来指导全局规划和辅助局部规划。实验证明我们的方法在复杂的真实世界模拟数据集上相比强基线能够取得优越性能，减轻了盲目试错和幻觉行为问题，为代理对世界的理解提供了有力支持，同时表明了 WKM 具有更好的泛化性能、弱 WKM 能指导强代理模型的规划，并且统一的 WKM 训练具有进一步发展的潜力。

May, 2024

使用条件神经自适应过程进行快速灵活的多任务分类

本文提出了一种基于条件神经过程的多任务分类方法，该方法可以在初步的多任务训练阶段后自适应地适应测试时遇到的新任务，并与元学习和少样本学习文献建立联系。实验结果表明，该方法在具有挑战性的 Meta-Dataset 基准测试中取得了最先进的效果，表明了高质量的迁移学习能力；而且该方法具有很好的稳健性，避免了低数据情况下的过拟合和高数据情况下的欠拟合，是一个计算效率高的测试时间方法，并且可以暂时不用迁移学习也可以在连续学习和主动学习方面取得超越现有方法的效果。

Jun, 2019

NPCL：针对不确定性感知的连续学习的神经过程

使用神经过程处理连续学习任务，通过任务特定模块和层次潜在变量模型，提供可靠的不确定性估计，并在不同任务间减轻遗忘现象。

Oct, 2023

面向物理无关对象的元学习再抓取策略

本文介绍了一种基于视觉的元学习算法 DexNet-CNP，通过条件神经过程来学习不同物理特性进行抓取，模型在各种物体上的测试结果优于 DexNet-2.0。

May, 2022

适应开放世界新奇性的神经符号世界模型

本文研究了如何提高强化学习算法的适应性，通过引入一种名为 WorldCloner 的训练神经符号世界模型，从而实现快速的新颖性适应，并使用想象力来辅助适应后的策略，达到更高的效率。

Jan, 2023