- 决策 S4:通过状态空间层实现高效基于序列的强化学习
本研究提出两种算法:一种通过轨迹实现离线训练,另一种通过一种基于稳定 Actor-Critic 机制的循环训练方法实现在线训练,实验结果证明该方法优于多种变体的决策 Transformer 以及其他基准方法,同时降低了延迟、参数数量和训练时 - 暴力检测技术概述:当前挑战和未来方向
本篇研究概述了深度序列学习方法及其用于暴力检测的本土化策略,对初始图像处理和基于机器学习的暴力检测进行了分析,详细描述了现有模型的优缺点并提出未来方向。
- 使用机械频率和游戏状态轨迹预测人物角色
本研究探讨如何通过玩家游玩记录高效预测玩家人设,使用监督学习和序列学习两种方法实现预测,强调计算科学在定义玩家人设方面的重要性。
- ICML潜在程序员:离散潜在编码用于程序综合
该论文提出了一种利用具有特定搜索目的的输出表示形式来解决大规模空间搜索问题的方法,通过先使用自监督训练离散自编码器,再将结果离散潜在编码用作建立端到端序列预测任务的中间目标来学习离散潜在编码,基于这些研究成果提出了一种名为 'Latent - ICML时序学习的时间相关任务调度
本文介绍了一种可学习的调度程序,用于序列学习,可适应地选择辅助任务以提高主任务的性能,通过双层优化联合训练,实验证明该方法显着提高了同时机器翻译和股票趋势预测的性能。
- 递归量子神经网络
通过构建一个由参数化的量子神经元组成的量子循环神经网络(QRNN),将量子计算与循环神经网络相结合,并通过序列学习和整数数字分类等任务进行了演示性能证明。
- 基于字符锚点池化的场景文本识别灵活特征获取新视角
提出了一对耦合模块,即 Character Anchoring Module(CAM)和 Anchor Pooling Module(APM),用于从二维空间中提取高级语义以形成特征序列并获得序列学习,通过此提出的模块,在不规则和不同角度场 - AAAI面向连续手语识别的时空多线索网络
本研究提出了一种空时多线索(STMC)网络,采用多线索学习方法解决了视觉序列学习问题,并在三个大规模连续手语识别基准测试上取得了新的最先进表现。
- AAAI脉冲神经网络实现生物学上可行的序列学习
提出了一种新的持续时间模型 ——McCulloch-Pitts 网络 (MPN), 用于序列学习,在棘突神经网络中,可以利用突触之间的不对称连接进行训练,能够稳健地记忆多个时空模式、二进制图片序列和实验神经脉冲数据的产生模型,并具有生物启发 - AAAI适用于循环神经网络的多区域单元
介绍一种用于处理序列学学习问题的新的多分区单元(MZU)来构建可以建模多个空间组合的转换函数的循环神经网络(RNN)。实验证明,MZU 在字符级语言建模任务和基于方面的情感分析任务的多个数据集上表现优越。
- 压缩变压器进行长序列建模
本研究介绍了压缩 Transformer,一种关注序列模型,用于长距离序列学习。在维基百科 103 和 Enwik8 基准测试中,我们发现压缩 Transformer 获得了最先进的语言模型结果,分别为 17.1 ppl 和 0.97 bp - 气象预报中用于温度预测的时空堆叠 LSTM
本文介绍了使用长短时记忆神经网络(LSTM)预测天气的方法。作者提出了一个 2 层的时空堆叠 LSTM 模型,其中第一层是独立的 LSTM 模型,第二层的输入是第一层 LSTM 模型的隐藏状态的组合。实验表明,通过利用空间信息,时空堆叠 L - AAAIPoint2Sequence: 基于注意力序列到序列网络学习三维点云的形状表示
本研究提出了一种名为 Point2Sequence 的新型深度学习模型,用于学习 3D 形状特征,通过一种新颖的隐式方法捕捉了区域内的细粒度上下文信息, Point2Sequence 采用点云的新颖序列学习模型,通过注意力归纳局部区域的多尺 - 循环注意力单元
本文提出一种名为 Recurrent Attention Unit 的循环神经网络模型,它将注意机制融入了 GRU 的内部结构中并通过增加 attention gate 提高了 GRU 对于长期记忆的能力,对于序列数据能够通过自适应选择序列 - 部分监督图像字幕生成
通过有标签的图片和物体检测数据教授图像字幕模型学习新的视觉概念,通过有限状态自动机表示部分指定的序列数据并提出了一种新颖的算法,可以训练神经网络。在图像字幕任务中,我们取得了基于 COCO 数据集的最新物体字幕任务的最先进结果,并进一步表明 - ICLR稳定的循环模型
本文针对循环神经网络的稳定性进行了深入探究,理论上证明在推断和通过梯度下降进行训练时,稳定循环神经网络可以很好地被前馈网络近似。实验上,我们展示了基准序列任务中稳定循环模型通常能够和不稳定的对应物一样好地发挥作用。这些发现揭示了循环网络的有 - AAAI基于骨骼的动作识别的时空图卷积
本文提出了一种称为 Spatio-Temporal Graph Convolution (STGC) 的方法,用于动作识别中的骨架,该方法组合了本地卷积过滤器的成功和自回归移动平均的序列学习能力,通过递归地进行多尺度局部图卷积过滤器构建。实 - NIPS更广更深,更便宜更快:张量 LSTM 用于序列学习
本文介绍了一种新的神经网络模型,即 Tensorized LSTM,它使用张量来表示隐藏状态,通过跨层卷积来更新这些状态。该模型在不增加额外参数的情况下,有效地扩展了网络的容量,并将深度计算合并为时序计算,从而提高了其性能。实验结果表明,该 - 使用 GRU 中心三明治结构模型进行交易欺诈检测
研究了一个新的 “内部 -> 之间 -> 内部” 三明治结构的序列学习架构,通过堆叠集成方法、深度顺序学习方法和另一个顶层集成分类器来提高欺诈检测目的的性能,同时引入了注意机制来进一步提高分类效果。
- 一种基于生物学启发式深度网络的学习长期依赖关系的动作识别方法
本文提出了一种神经网络 shuttleNet,可以结合 CNN-RNN 框架来进行更有效的序列学习,其特点在于运用了循环反馈连接和注意力机制来模拟神经系统中的信息流动。