进化算法中新颖性的出现
本文结合高效的进化策略算法(ES)、直接探索策略和进化智能技术,提出了一种新型快速可扩展的在深度强化学习任务中进行探索的算法,通过在 Atari 游戏和机器人学习领域的实验验证,提高了 ES 在稀疏或陷阱型的深度 RL 任务中的表现。
Dec, 2017
本文提出一种强化学习算法,通过自编码器将已发现策略的状态序列进行度量,以此产生新的策略,同时利用两个目标的策略梯度算法在策略更新中权衡任务奖励和新颖度奖励,最终得到一些解决特定任务和具有差异化行动序列的策略,并展示该方法在迷宫导航,机械臂和蹦跳机器人的运动任务以及对抗性任务中的有效性。
May, 2019
本文探讨了一种基于进化博弈论思想的解决方法来解决一组同质且自主代理在未知且随机环境中的路径规划问题,研究了多智能体规划方法,并展示了我们的技术在大空间中最小化路径长度方面击败了现有的状态良好的强化学习算法近 30%,并且比深度强化学习方法快至少一个数量级,并且与其他方法相比,扩展性更好,最后,我们证明了我们学到的政策在演化上是稳定的。
Dec, 2022
本文认为好奇心是一种进化机制,能够在智能体的一生中鼓励有意义的探索,以暴露它于能够使其获得高报酬的经验。该文提出了一种基于元学习的产生好奇行为的问题,并使用元学习算法将代理人的奖励信号动态调整来解决问题。作者进一步提出使用元算法来扩大其适用性,并将其他构建块(例如缓冲器、最近邻模块和定制丢失函数)与神经网络结合使用。最终,本文提出的两种好奇心算法在图像导航、机器人和其他领域表现优于人类设计的已发表算法。
Mar, 2020
本文提出了一种将粒子群优化算法与新颖性搜索相结合的方法,该方法通过新颖性搜索寻找搜索域中的新颖点,然后使用粒子群优化算法在该区域内搜索全局最优解,该方法在处理存在大量局部最优解和次全局最优解远离真正最优解的函数时表现良好。
Feb, 2022
本文介绍了一种应对开放性场景中新颖性挑战的方法,该方法结合了逻辑表示和推理方法,利用通用方法和架构机制检测、表征新颖性,并构建相应的适应性模型进行应对。通过在多智能体博弈中的评估,结果表明所提出的方法在各种新颖性挑战下均表现出高准确率。
Feb, 2023
本文以智能搜索技术在人机系统中的应用为出发点,提出了一种新的多智能体协作搜索方法,并通过实验结果表明,该方法优于传统的手动设计策略和传统树状搜索方法,并能够用于研究不同的人类创造性活动。
Jun, 2023
通过大量的实验和消融分析,我们分析了不同表征、进化搜索和各种聚类方法在异构群体中寻找新行为的影响。我们的研究结果表明,先前的方法未能发现许多有趣的行为,而迭代人在环节的发现过程比随机搜索、群体化学和自动化行为发现方法发现了更多的行为。我们的实验中发现了 23 个新的紧急行为,其中 18 个是新发现。据我们所知,这些是首个已知的计算无关代理异构群体的紧急行为。
Oct, 2023