- 神经网络与摩擦:滑动、保持、学习
通过训练具有门控循环单元(GRU)结构的递归神经网络(RNNs),本研究证明它们具备学习合成数据中速率状态摩擦定律复杂动力学的能力。我们的方法的一个新颖之处在于定义了损失函数,明确考虑了初始条件、直接影响和训练过程中状态变量的演化。研究发现 - 利用工地外观和空间利用自动化前瞻规划
该研究提出了一种自动化开发前瞻规划的方法,该方法利用建筑材料条件和场地空间利用率来预测任务完成率。通过训练基于门控循环单元的循环神经网络模型,估计任务完成率并提出数据感知的前瞻规划。结果表明该方法可以帮助开发自动化前瞻规划,并将施工规划与实 - 基于自适应降噪技术和时域卷积网络的风电场超短期多步风速预测
提出了一种基于数据降噪技术、时序卷积网络(TCN)和门控循环单元(GRU)的新型风速预测模型,通过数据降噪、特征提取和序列预测实现了具有高精度和强稳定性的风速预测,为风电场的运行和管理提供了支持。
- 记忆训练场:无尽回合中基于记忆的智能体面临的部分可观测挑战
Memory Gym 引入了一种独特的基准测试,旨在测试深度强化学习代理的能力,具体比较门控循环单元(GRU)和 Transformer-XL(TrXL)在记忆长序列、抵抗噪声和泛化能力方面的性能。
- 利用可解释人工智能检测传感器间的差异
本研究使用可解释人工智能方法的 SHAP,通过机器学习从中识别贡献最大的传感器来检测感测器之间的变化,并利用奥氮平来测试其方法的应用性,从而证明了这种方法可以提高传感器方法的效率和准确性。
- 离散傅里叶变换分析循环神经网络归纳偏置的实证研究
本研究旨在揭示循环神经网络的归纳偏差,即输出序列频率,LSTM 和 GRU 的归纳偏差偏向于低频模式,而 Elman RNN 则倾向于学习高频输出模式,同时发现 LSTM 和 GRU 的归纳偏差会随着层数和隐藏层大小的变化而改变。
- 面向易受野火影响地区的广义多因素深度学习电力负荷预测模型
该文提出了一种基于 Gated Recurrent Unit 的深度学习方法,用于预测澳大利亚维多利亚州在野火季节中的电力负荷,模型考虑到多个因素,使用降温关联因素以及灵活的数据输入结构,与 LSTM 相比表现更好,可以实现 3%的平均预测 - CVPR一个轻量级的主动说话人检测模型
提出了一种轻量级的主动说话人检测框架,通过减少输入候选信息、分离 2D 和 3D 卷积进行音视频特征提取、并应用门控循环单元(GRU)进行跨模态建模,可以在计算、资源消耗上比现有方法表现更优。
- 如何为预测每个时间序列的行为选择最佳的 RNN 单元结构?
本研究旨在提供所有时间序列行为的全面分类法以及为每种行为提供最佳循环神经网络结构的见解,表明 MGU-SLIM3 细胞最适合确定性和非线性行为,MGU-SLIM2 细胞最适合随机游走行为,FB1 细胞最适合长记忆行为,LSTM-SLIM1 - ICLR使用多网格求解器并行训练 GRU 神经网络处理长序列
该论文提出了一种新的并行剪枝方案(称为 “并行化时间”),基于多网格时间缩减(MGRIT)求解器对 GRU 进行训练,可以在序列长度增加时显著提高性能,实验结果显示,与串行方法相比,新的并行化训练方案实现了高达 6.5 倍的加速比。
- 针对自开发开放式肺音数据库 HF_Lung_V1,对八种循环神经网络变体进行呼吸相和意外音检测效果基准测试
研究开发了一个肺音数据库,使用各种机器学习模型实现了呼吸相和异常肺音的检测,在多项定义任务中,双向门控循环单元模型展示了最佳的 F1 评分和接收器操作特性曲线下的面积。
- 社交和情境感知的人体运动和姿势预测
本文提出了一种新的框架来处理机器人导航中预测人类动态的问题,该框架将人类运动(或轨迹)和骨骼姿态预测这两个任务统一起来,并考虑到了场景和社交上下文等多种因素,最终在两个社交数据集上表现优异。
- CVPR使用图神经网络学习家具兼容性
本研究提出了一种基于图神经网络(GNNs)的方法,通过图结构捕捉家具家庭的内在关系,进而预测家具套装的风格是否兼容,并在 Bonn 和 Singapore 家具数据集上展示了最先进的预测精度。
- AAAI利用时序感知神经序列模型进行系统辨识
本文介绍了一种基于时间的递归神经网络扩展模型,使其适用于不均匀采样的连续变量观测数据,并展示了该模型在两种工业输入 / 输出过程的样本中的有效性。
- 基于时空表征的面部心率端对端估计
本文提出了一种基于 RhythmNet 的心率远程估测方法,并建立了一个大规模的多模态心率数据库(VIPL-HR),其包含 2,378 个可见光和 752 红外视频,该方法在公共数据库和 VIPL-HR 数据库上都表现出优异的表现。
- 关于循环神经网络的计算能力
证明有限精度下具有 ReLU 激活函数的 RNN 和 GRU 等神经网络具有等价于确定性有限自动机 (DFA) 的计算能力,如果允许任意精度,则具有至少与下推自动机 (PDA) 相同的计算能力,如果同时允许无限精度,无限边权和非线性输出激活 - GRU-ODE-Bayes:稀疏时间序列的连续建模
提出了一种 GRU-ODE-Bayes 方法来建模真实世界的多维时间序列,该方法包括对神经普通微分方程的连续时间版本和处理不规则数据采样的贝叶斯更新网络,并证明了该方法在医疗保健和气候预测领域的应用中优于现有技术。
- ACLCAN-NER:用于中文命名实体识别的卷积注意力网络
本研究探讨了一种名为 Convolutional Attention Network (CAN) 的中文命名实体识别方法,该方法基于字符级卷积神经网络与门控循环神经网络,通过局部注意层和全局自注意层来捕获相邻字符和句子上下文的信息,并不依赖 - 循环注意力单元
本文提出一种名为 Recurrent Attention Unit 的循环神经网络模型,它将注意机制融入了 GRU 的内部结构中并通过增加 attention gate 提高了 GRU 对于长期记忆的能力,对于序列数据能够通过自适应选择序列 - 遗忘门的不合理有效性
本文提出了一种仅含遗忘门的 LSTM 神经网络模型(即 JANET),采用 chrono-initialized 偏置技术,经实验证明该模型在多个基准数据集上不仅提高了计算效率,而且性能表现较传统 LSTM 网络更优,达到了 99% 和 9