双向渐进神经网络与情节回报进展用于新兴任务排序和机器人技能迁移

Mar, 2024

双向渐进神经网络与情节回报进展用于新兴任务排序和机器人技能迁移

Bidirectional Progressive Neural Networks with Episodic Return Progress for Emergent Task Sequencing and Robotic Skill Transfer

PDF

Suzan Ece Ada, Hanne Say, Emre Ugur, Erhan Oztop

TL;DR人脑和行为为机器人学习和控制方法提供了灵感，该研究介绍了一种新的多任务强化学习框架 ERP-BPNN，它具有人类类似的交替学习方式，可实现任务间的双向技能转移，并在达到任务中与传统方法相比，对于形态不同的机器人在到达目标的距离、路径直线性等度量指标上实现了更快的收敛和改进。

Abstract

human brain and behavior provide a rich venue that can inspire novel control and learning methods for robotics. In an attempt to exemplify such a development by inspiring how humans acquire knowledge and transfer skills among tasks, we introduce a novel →

human brain and behavior multi-task reinforcement learning bidirectional skill transfer neural architecture robotics metrics

发现论文，激发创造

渐进式神经网络

本论文研究了使用 Progressive Networks 这种方法来解决转移学习和遗忘问题，通过提出新的敏感性测量方法来评价该方法在各种强化学习任务上的表现，并表明它优于基于预训练和微调的常见基线。

Jun, 2016

神经形态计算 deep learning 机器

本篇论文介绍了一种名为 Event-Driven Random BP (eRBP) 规则的神经形态计算方法，可用于学习深度表示，其具有在神经形态硬件中实现的优势，并且与 GPU 上的人工神经网络模拟相比，分类准确性相近且在学习过程中鲁棒性较强。

Dec, 2016

深度预测策略训练采用强化学习

通过使用深度预测策略训练框架，该研究提出了一种有效的方法来训练预测动作策略，使用合成和模拟训练样本来强制进行视觉和运动数据的抽象，以及使用策略搜索强化学习方法来训练每个任务的策略超层，该框架在 PR2 机器人上训练物体抓取和投球等技能任务，并且训练样本只使用了约 180 次实际机器人尝试，达到了很好的效果。

Mar, 2017

基于逐层神经网络的像素级仿真机器人学习

利用 Progressive Networks 框架实现了真实环境中机器人在视觉输入条件下进行复杂任务的学习，该方法可以通过在模拟环境中进行模型训练和预先学习来优化真实世界中的策略和性能，而不必依赖于模型基础的轨迹优化。

Oct, 2016

基于脑电波的隐式人类反馈加速强化学习智能体

该研究提出通过 EEG 作为自然反应的形式来捕获人类的内在反应作为隐式反馈，并将人类智能通过隐式反馈与 RL 算法相结合，以加速 RL 智能体的学习。

Jun, 2020

一种用于在卫星图像流中检测任务单次试验事件相关电位的分布式推理系统

该研究介绍了一种适用于在卫星图像流中检测任务式单次事件相关电位的分布式推理系统，通过利用多个优化于特定任务的模型，确保在各种图像转换时间和目标出现时间下实现卓越性能，在两个范式中试验结果表明，该系统在目标检测中优于传统方法，并且在 AI 范式中引入边界框显著提高了目标识别效果。

Nov, 2023

神经元事件控制

本文提出了一种深度强化学习代理 —— 神经记忆控制器，该代理能够快速地接受和处理新经验并表现出针对这些经验的行为，并使用半表格化价值函数表示：包含缓慢变化状态表示和快速更新价值函数估计的过去经验缓冲区。研究表明，与其他最先进的通用型深度强化学习代理相比，该代理在各种环境中学习速度明显更快。

Mar, 2017

用于训练深度递归脉冲神经网络的脉冲序列级反向传播

本文介绍了一种用于训练深度 recurrent spiking neural networks 的新算法：Spike-Train level RSNNs Backpropagation (ST-RSBP)。该算法通过直接计算网络输出层中定额编码的 loss function 相对可调参数的梯度来训练 RSNNs，在 TI46、N-TIDIGITS、Fashion-MNIST 和 MNIST 等数据集上都表现出了优于当前最先进的 SNN BP 算法和传统的非 spiking 深度学习模型的准确性。

Aug, 2019

基于生物学启发的循环神经网络学习的反向传播时序算法替代方案

通过实时与合适的自上而下学习信号合并本地可用信息，为循环神经网络提供了高效的学习算法，其中包括了神经形态芯片的在线训练，从而拓宽了大脑中的网络学习理解并在实验中得到了验证。

Jan, 2019

基于视觉情节记忆的探索

使用视觉情节记忆作为内在动机的机器人探索问题的研究，通过卷积递归神经网络自编码器学习时空特征的高效表达，结构相似度作为内在动机信号来引导探索，超过了好奇心驱动的变分自编码器在发现动态异常方面的表现。

May, 2024