- 利用最优输运和动力学先验进行部分观测轨迹推断
通过部分观测数据推断潜在轨迹的方法被称为 PO-MFL,该方法在可观察状态空间模型中引入了基于熵的最小估计器,并使用调整后的动力学相邻时间边缘之间的熵传输来解决潜在轨迹推断问题,实验证实了该方法的鲁棒性及 MFL 动力学的指数收敛性。
- 如何在 POMDPs 中通过信念进行探索:状态熵最大化
本文研究了强化学习中的状态熵最大化,针对部分观测的真实状态提出了一种内存和计算效率高的策略梯度方法,解决了目标近似、优化和幻觉问题,旨在推广状态熵最大化到更现实的领域。
- ICML未知游戏中的无遗憾学习的乐观汤普森抽样
我们开发了一种基于 Thompson 抽样的算法,利用关于对手行动和奖励结构的信息来应对部分信息和多机构的挑战。在交通路由和雷达感知等实际应用中,我们的方法显著减少了实验预算,与基准算法相比,实现了超过十倍的减少。此外,本研究还引入了乐观 - 缺失局部保角自编码器:异质数据融合的赞颂刚性
利用多自编码神经网络架构,将多个部分观测集合融合到一致的潜在空间,解决了多传感器测量融合的问题,并通过几个实例证明了该方法的有效性。
- 早期动作识别与动作原型
利用部分观察到的视频和原型表示,我们提出了一种早期行为识别模型,通过训练视频的短片段来预测行为并在多个实际数据集上取得了显著的改进。
- 通过风格调制的生成对抗网络实现多样化的形状补全
通过引入多样性惩罚和多尺度鉴别器,我们提出了一种新颖的条件生成对抗网络,可以从部分观察到的点云中生成多种多样的合理完整形状,这一方法在尊重部分观测的同时获得了更大的完成多样性。
- 利用前向模型的扩散:无需直接监督解决随机逆问题
本文提出了一种基于去噪扩散概率模型的条件生成模型,通过把一个已知的、可求导的正向模型集成到去噪过程中,实现了间接观测信号的采样, 并在三项具有挑战性的计算机视觉任务中进行了验证。
- 从部分数据中重构、预测和稳定混沌动态
通过使用基于数据的方法,该研究提出了 Long Short-Term Memory (LSTM) 网络来推断未观察到的(隐藏的)混沌变量的动力学,时间预测完全状态的演变并推断其稳定性。
- 结构化低秩张量学习
提出了一种基于流形的张量低秩分解方法,利用 Riemannian 优化算法解决了存在结构约束和部分观测时的优化问题,并在非负约束和 Hankel 约束下得到了验证。
- ICLR对比元学习用于部分可观测少样本学习
通过使用概率形式化方法,该研究提出了一种部分观察专家建模(POEM)的方法,通过集成不同的视图,反向推导出一致的表示方法,从而对部分观察进行元学习,从而比其他元学习方法更好地进行表示学习。
- ICLR针对复杂部分观测的判别式粒子滤波强化学习
本文提出了一种新的强化学习框架 DPFRL,它采用区分性粒子滤波器来进行对复杂部分观察的明确推理,同时在决策中使用学习的区分性更新方法,提高了性能并解决了复杂观测建模的难题,提出的基于矩函数的信念特征在 Flickering Atari G - AAAI基于线性规划的目标识别规划方法
本文提出了一种基于算子计数框架的方法来有效计算符合观察结果的解,用于解决目标识别任务,并对部分和噪声观测进行估计和满足观测。通过大规模数据集的实证评估,证明了该方法在一致性比率、准确性和分散性等方面优于以往方法,同时为解决目标识别任务的组合 - 大型网络在低可观测性条件下的局部层析成像
本文通过对智能体状态演化的观察研究了重构相互作用智能体网络拓扑图的问题。在大规模网络设置下,仅有一小部分智能体可以实际被观察到。我们旨在推断出底层互动子网络,称之为局部层析问题。在这种情况下,本文的主要结果是,在该设置下,在满足网络模型的某 - Catch'Em All: 使用部分观测定位网络中的多个扩散源
研究了网络中多重扩散源的定位问题,提出了一种称为 OJC 的新的源定位算法,该算法通过候选人选择算法提取子图来选择源候选人,然后在提取的子图中,OJC 找到一组节点,它们覆盖了最小半径内的所有观察到的感染节点,这组节点被视为扩散源。通过在 - 部分可观察 MDPs 的深度循环 Q 学习
本文介绍了一种新型深度强化学习模型 Deep Recurrent Q-Network (DRQN),使用 recurrent LSTM 替换 DQN 的第一个后卷积全连接层,DRQN 在每个决策点只看到一个帧,但可以成功地通过时间积分信息,