关键词curiosity-driven exploration
搜索结果 - 8
- ICLR大型语言模型的好奇心驱动的红队扮演
通过好奇心驱动的红队(CRT),我们提出了一种自动生成测试用例的方法,以增加生成的测试用例的覆盖范围,并成功地从经过重度优化以避免有害结果的 LLaMA2 模型中引发有害回应。
- 多环境中基于好奇心和熵驱动的无监督强化学习
使用 alpha-MEPOL 方法,在多个环境中处理无监督强化学习,通过对整个环境类的交互进行无任务探索策略的预训练,再使用监督微调该策略来处理不同任务,通过样本轨迹采样、动态 alpha、更高的 KL 散度阈值、基于好奇心的探索以及好奇心 - 以混合目标为驱动的好奇心多智能体探索
本文提出了一种基于好奇心驱动的多智能体共探算法,旨在鼓励多智能体在合作环境中探索独特而有意义的动作以达到最佳表现。实验表明,这种好奇心驱动的探索方法能够有效促进多智能体整体探索并提升共同导航任务中稀疏奖励的 MARL 算法的表现。
- BYOL-Explore: 基于自举预测的探索
BYOL-Explore 通过优化单一预测损失,在潜在空间中学习世界表示、世界动态和探索策略,实现在视觉复杂环境下的好奇心驱动探索。此方法可有效解决部分可观察连续行动的具有挑战性的难度探索基准和 Atari 游戏等任务。
- 通过视听联想实现好奇心
该研究提出了一种利用多个感官之间的新奇性联想来引导学习代理在缺乏外部奖励的情况下进行更高效探索的方法,并展示了在几个 Atari 环境和 Habitat 中使用音频 - 视觉关联模型的益处。
- 基于好奇心的多标准事后经验回放
本文提出一种方法,将后见之明与好奇心驱动探索和课程学习相结合,以解决具有挑战性的稀疏奖励堆叠块任务,并且此方法成功地实现了在机器人手臂上堆叠两个以上的块,而无须使用人的演示。
- 永不忘记:通过学习光流实现探索和开发的平衡
本研究提出了利用光流估计来评估新观测的新颖性,以解决深度强化学习中高维观测任务下探索和开发之间平衡的问题。实验结果表明,该方法相对于以前的方法具有更优异和持久的性能。
- 学习去耦合目标空间的好奇心驱动探索
本文介绍了如何使用内在动机和深度学习算法来有效生成目标空间,提出了使用解耦目标空间可以更好地进行探索,同时利用模块化学习进度驱动求知型探索,同时发现了环境的独立可控特征。