重复博弈中预测人类互动的神经网络
通过神经网络方法,基于人类非语言行为,实现机器人对人类行动的预测,具有重要的应用价值。我们通过特征选择等手段,扩展了现有研究,设计出一种可以预测多个、不同长度动作序列的编码 - 解码循环神经网络拓扑结构,并论证了预测多个动作序列对协作场景奖励的估算十分重要。最后,在包含人类动作数据的动作预测数据集上进行有效训练,并探究了参数对性能的影响。
Feb, 2018
使用特殊的神经网络,将 Social Force Model 嵌入结构,提高人类运动的预测精度和安全性,解释可行,且具有广阔的应用前景和实验支撑。
Jun, 2020
本研究提出了一种基于神经记忆网络的新框架,用于未来动作序列预测,通过使用神经记忆网络捕捉序列内部的短期关系和序列之间的长期关系,有效地融合了特征,取得了比现有方法更好的预测效果。
Sep, 2019
AI 模型在围棋游戏中超越了人类选手,解释 AI 模型所编码的围棋知识并将其用于教导人类选手代表着一个具有前景但具有挑战性的问题。为此,本文提取围棋游戏价值网络所编码的棋子之间的交互原语,以使人们能够从价值网络中学习。实验表明了我们方法的有效性。
Oct, 2023
本文利用专家示范解决关于建模长时间轨迹的问题,通过提出一种层次化神经网络结构,能够在高维状态空间中,自动识别长短期目标,进而实现不同于传统方法由单一策略为核心,解决了传统方法在涉及长期行为建模上的局限。作者以模拟篮球运动轨迹的案例为例,通过专业体育分析师的判断得出,相较传统基准方法,作者提出的层次化策略能够生成更为真实的轨迹。
Jun, 2017
本文旨在研究人体运动建模领域的前沿研究,特别关注基于深度递归神经网络的研究成果,对当前问题的评价方法进行了调查,在研究现有的体系结构、代价函数和训练程序时,提出了三点标准改进措施,取得了最新技术的突破性进展。
May, 2017
该论文研究解决游戏人工智能的反应延迟问题,通过给智能体一个神经预测模型滞后,展示了超级斗地主 Bros. Melee 等游戏中对抗专业玩家的有效性。
Oct, 2018
提出了一种在神经网络控制下自适应地利用先前学习的网络的知识转移方法,实现了高维序列决策领域的增量学习和知识迁移,在 Atari 2600 游戏中得到了成功的验证。
Dec, 2015