通过对比行为总结展示自主机器人能力
本文提出了一种数据驱动、模型无关的技术,用于生成一个易于人理解的摘要,概括一个演变动力系统(如控制代理的学习过程)中的显著对比要点。该技术根据信息论差异度沿时间和空间维度对转换数据进行聚合,并以图形和文本通信方法为辅助,对连续状态空间下的深度强化学习代理的学习历史进行摘要。我们期望我们的方法能够补充现有的代理可解释性技术。
Jan, 2022
我们提出并展示了在虚拟环境中给出机器人行为的自然语言摘要的任务,针对该任务,我们提出并测试了几种生成这样摘要的方法,并设计了一个基准模型,可作为未来工作的基础。
Mar, 2022
本文探究了不同模型用于提取摘要的作用,引入了基于所谓的模仿学习的策略总结方法,并论证了从提取摘要到重建策略所用的模型不匹配可能导致更差的重建质量;同时也通过人类主体实验表明:不同的背景下人们重构策略所采用的模型存在差异,而采用匹配的摘要提取模型可以提高性能。因此,这表明在策略总结中需要仔细考虑用户的模型。
May, 2019
通过自然语言处理,机器学习研究了通过视频和提示对机器人过去动作进行总结和问题回答,并开发了自动生成问题与答案的方法。将总结和问题回答集成于单一系统,通过零 - shot 迁移学习来提高动作总结的准确性。
Jun, 2023
介绍人工智能领域中对于开发具有自主性并与其它实体有效交互的代理人的方法,重点讨论了不同建模方法及其基础方法学和前提条件,涉及方法学和实际应用,最后阐述了未来研究的潜在课题。
Sep, 2017
该文章重点讨论解释目标驱动型智能代理人和机器人的方法,强调透明度、可理解性和持续学习的策略。它提出了可行的目标驱动可解释代理人和机器人的实现路径和要求。
Apr, 2020
本研究结合全局与局部解释方法,通过用户研究评估其共同和单独的贡献,其中将模拟代理程序中的重要状态转换提取为策略概述,并为用户提供注重的信息,结果表明,如果概要包括重要状态的话,人们理解代理程序的能力显著提高。尽管加入显著性地图在大多数情况下并没有显著提高性能,但确实有一些证据表明显著性地图可以帮助用户更好地理解代理程序在决策过程中依赖的信息,为未来的工作提供了建议。
May, 2020
本文介绍了一种利用自主生成的行为特征描述模拟机器人环境中任务的质量 - 多样性(Quality-Diversity)算法,可以自主发现各种解决方案来处理导航、高速前进和半滚动任务。
Nov, 2022