卷积神经网络在奖励塑造中的应用

Oct, 2022

卷积神经网络在奖励塑造中的应用

Reward Shaping Using Convolutional Neural Network

Hani Sami, Hadi Otrok, Jamal Bentahar, Azzam Mourad, Ernesto Damiani

TL;DR本文提出了一种用 CNN 进行的潜在基于价值的奖励塑造机制 VIN-RS，该方法基于 Hidden Markov Model 的信息传递机制对 CNN 进行训练，并通过自我学习的卷积过滤器估计环境的转移矩阵，实现了有效的潜在函数的构建。通过对表格游戏、Atari 2600 和 MuJoCo 的实验表明，与现有技术相比，VIN-RS 具有更快的学习速度和最大累积奖励。

Abstract

In this paper, we propose value iteration network for reward shaping (VIN-RS), a potential-based reward shaping mechanism using Convolutio

convolutional neural network reward shaping value iteration network hidden markov model transition matrix

发现论文，激发创造

Conv-INR: 多模视觉信号的卷积隐式神经表示

本文提出了 Conv-INR，这是第一个完全基于卷积的 INR 模型，相较于现有的基于多层感知机的 INR 模型，Conv-INR 具有更好的表示能力和可训练性，同时能够有效地学习邻近坐标和高频组成部分。通过广泛的实验验证了 Conv-INR 在图像拟合、CT/MRI 重建和新视角合成等四个任务中明显优于现有的基于多层感知机的 INR 模型，而且在不引入额外推理成本的情况下，还提出了三种进一步增强 vanilla Conv-INR 性能的重新参数化方法。

Jun, 2024

音乐作曲的循环潜变量模型再思考

本文提出了使用卷积变分递归神经网络对音乐进行特征捕捉和创作新音乐序列的模型，通过编码器 - 解码器架构和概率连接捕获音乐的隐藏结构，并使用 Variable Markov Oracle 方法对不同神经网络类型的性能进行比较，结果表明所提出的模型具有更好的统计相似性和更好地保留了原始音乐的风格。

Oct, 2018

卷积神经网络在图结构数据上的推广

本研究介绍了一种卷积神经网络的泛化方法，使其适用于图形结构数据，使用随机游走揭示输入数据内部关系，通过学习底层图将其应用于许多标准分类或回归问题。

Apr, 2017

卷积循环神经网络用于动态磁共振图像重建

提出了一种新颖的卷积循环神经网络（CRNN）结构，通过联合利用时间序列的依赖性和传统优化算法的迭代性质，从高度欠采样的 k 空间数据中重建高质量的心脏 MR 图像，同时学习时空相关性，优于当前 MR 重建方法在计算复杂性、重建准确性和速度方面。

Dec, 2017

利用图卷积循环神经网络进行结构化序列建模

本文介绍了图卷积循环网络（GCRN），这是一种深度学习模型，能够预测结构化数据序列。GCRN 是经典递归神经网络（RNN）在任意图结构数据上的泛化。该模型将图上的卷积神经网络 (CNN) 与 RNN 相结合，以找出动态模式和空间结构，并将其应用于 MNIST 数据预测和 Penn Treebank 数据集的自然语言建模。实验表明，同时利用数据的图空间和动态信息可以提高精度和学习速度。

Dec, 2016

使用连续递归神经网络建模分层结构

本文提出 Continuous Recursive Neural Network (CRvNN) 作为递归神经网络（RvNN）的可替换方案，以解决传统 RvNN 在处理序列中诱导潜在结构方面的局限性，并通过在潜在结构中引入连续松弛来改进该方案，从而在逻辑推理和自然语言处理等多项任务中取得了显著表现。

Jun, 2021

使用 SincNet 从原始波形中进行说话人识别

本文介绍了一种新的卷积神经网络架构，称为 SincNet，它使用基于参数化的 sinc 函数实现带通滤波器，以从原始的语音样本中学习低级别的语音表征，以更好地捕捉重要的窄带说话人特征，实验表明，该网络架构比标准的 CNN 在原始波形上更快地收敛并且表现更好。

Jul, 2018

使用卷积神经网络解决大规模空间问题

本文探讨了如何通过使用转移学习和卷积神经网络等技术来提高大规模空间问题的训练效率，提出小信号窗口训练成果可在大信号上应用的理论，并在移动基础设施方面得到了实证支持。

Jun, 2023

多分辨率物理信息循环神经网络：配方及应用于肌肉骨骼系统

提出了一种多分辨率物理信息循环神经网络 (MR PI-RNN)，用于同时预测肌肉骨骼 (MSK) 运动和识别 MSK 系统参数，该方法利用快速小波变换将混合频率的表面肌电图 (sEMG) 和关节运动信号分解为嵌套的多分辨率信号，并且采用分层训练的方法设计了一个 GRU 预测模型，并通过逐步训练的方式获得全尺寸训练结果，在保持动态平衡的同时，提高了肘部屈伸运动的运动预测精度。

May, 2023

深度卷积图网络的分层视频帧序列表示

本文提出了一种基于深度卷积图神经网络的视频分类方法，利用视频的分层结构特性通过图网络对视频帧序列进行多级特征提取，获得反映事件语义的视频表示，其在 YouTube-8M 大规模视频理解数据集上的表现优于基于 RNN 的基准模型。

Jun, 2019