测量新颖反应的难度
本文介绍了一种应对开放性场景中新颖性挑战的方法,该方法结合了逻辑表示和推理方法,利用通用方法和架构机制检测、表征新颖性,并构建相应的适应性模型进行应对。通过在多智能体博弈中的评估,结果表明所提出的方法在各种新颖性挑战下均表现出高准确率。
Feb, 2023
研究 AI 代理人的鲁棒性来应对新奇环境,DARPA 的 SAIL-ON 计划致力于开发必要的科学来评估代理人的鲁棒性,同时利用实验室实验中使用的技术来衡量代理人检测、表征和适应新奇性的能力。
Feb, 2023
我们提出了一种将新颖性检测引入世界模型强化学习代理中的直接边界方法,通过利用世界模型产生的虚拟状态与真实观察状态的不一致作为异常得分,有效探测并保护代理在新环境中的性能和可靠性。
Oct, 2023
通过团队自身所遇到的不确定性问题,本研究针对 AI 在处理 novelty(新颖性)问题时的困难,提出了第一个统一的框架,并且给出了公式化的定义方法,以适用于多个领域。该框架填补了相关领域的研究空白,并有助于推动该方向的研究进展。
Dec, 2020
研究提出了一种新奇性改进的强化学习方法,针对具有改变环境机制 / 属性的新奇性,提出了 NovGrid 框架及其本体,以及可以应用于 MiniGrid 兼容环境的新奇性模板,并通过内置度量指标评估了基线强化学习模型的特征。
Mar, 2022
本研究介绍了一个新的基准数据集 NovelCraft,包含在 Minecraft 环境中完成跳跃球组装任务的代理人所看到的图像和符号世界状态的多模态故事数据。进一步的多模态新颖性检测实验表明,融合视觉和象征信息的方法能够提高检测时间和总体识别能力,同时对于复杂场景中新不平衡分类的适应仍然是一个令人兴奋的开放性问题。
Jun, 2022
本文研究了如何提高强化学习算法的适应性,通过引入一种名为 WorldCloner 的训练神经符号世界模型,从而实现快速的新颖性适应,并使用想象力来辅助适应后的策略,达到更高的效率。
Jan, 2023
这篇论文提出了一个开放世界模型和元特征系统,专注于在新旧世界之间的客观特征分布差异的基本识别,并通过元特征的牵引力实现了对新旧世界中学习能力的量子隧穿效应。该模型在学习新知识方面表现出色(以行人重识别数据集为例),最高可达 96.71%的准确度,并获得了类似于人类的探索新知识的能力。
Nov, 2023