- Hénon 映射中后续步骤预测的比较分析
深度学习在预测混沌系统演化中的重要性,通过对 H'enon 地图使用多种机器学习技术的性能评估,结果表明 LSTM 网络在预测精度上表现出优势。
- 评估 LSTM 网络中协变量预测的有效性用于时间序列预测
LSTM 网络在时间序列预测任务中表现出色,但是在集成未来、依赖时间的协变量方面的结构不够灵活。本研究通过引入高度相关的协变量到未来时间步的人工时间序列数据集中,评估了 LSTM 网络在考虑这些协变量时的性能,并将其与单变量基线进行了比较。 - 非参数化端到端概率分布式发电产量预测考虑缺失数据插补
本论文介绍了一种非参数的端到端方法,用于在包括缺失数据插补的情况下对分布式可再生能源生成输出进行概率预测。
- 长篇电视新闻节目视频的多模态分章
我们提出了一种自动化分章节的电视新闻节目视频的新方法,通过冻结神经网络和训练的 LSTM 网络,集成了音频和视觉线索来准确生成节目片段边界,并在 500 多个电视新闻节目视频的多样数据集上进行了评估,结果表明这种创新的融合策略达到了最新性能 - 使用长短期记忆网络预测 ICU 病死率
实验结果突出了 LSTM 模型对建立真实世界预测引擎的高效性,通过利用严格的多变量时间序列测量将时间框架缩小到 6 小时,这个自动数据驱动系统可以分析从电子健康记录中得出的大量多变量时间数据,提取高级信息以早期预测住院死亡率和住院时间。
- 使用长短期记忆网络从右至左和头至足组分中重建三轴心动图
本文旨在开发一个深度学习模型,从横向和纵向的 SCG 信号中预测骶麟方向的 SCG 信号,并通过使用双轴加速度计获得的数据,展示了深度学习模型重构三轴 SCG 信号的潜力。
- 使用 Wav2Vec 2.0 识别器进行深度 LSTM 口语检测
本文利用基于字符的 Wav2Vec2.0 模型进行了大规模口语文档中的术语检测任务,实验结果表明,使用基于深度 LSTM 网络的共享发音嵌入空间的 bootstrapping 方法将 DNN-HMM 混合 ASR 的传统发音词汇的知识转化到 - 解释我的惊讶:通过预测不确定结果学习高效的长期记忆
本文提出了一种新的训练方法 MemUP,可以在不需要同时反向传播整个序列梯度的情况下学习长期依赖关系,用于训练 LSTM 网络表现表现良好,并需要存储更少的中间数据。
- 基于长短期记忆网络的医疗保险数据预测再入院率的进展
利用保险数据,通过构建双向 LSTM 神经网络,本研究成功预测了医院的所有诊断病例中患者 30 天再次入院的风险。与随机森林分类器的结果相比,LSTM 模型的性能显著提高,证明了序列预测在该问题中的重要性。同时,加入了 30 天的历史数据后 - 基于手机传感器数据的抑郁症诊断和预测
本文研究了利用移动电话数据进行抑郁症预测的方法,并提出了使用 LSTM 网络进行建模的解决方案,实验结果表明该预测任务的准确率与抑郁症诊断任务相当,精度可达 77.0%。
- DRF Codes: 深度信噪比强健反馈编码
利用长短时记忆网络(LSTM)和信噪比(SNR)感知注意力机制进行深度神经网络(DNN)编码纠错,用于在具有输出反馈的衰落信道中实现更可靠的通信,并在在多播信道中进行了有效性验证。
- ICCV层次化舞蹈视频识别无监督 3D 姿态估计
提出了一种分层舞蹈视频识别框架 (HDVR),它通过估计 2D 姿势序列,跟踪舞者,并同时估计相应的 3D 姿势和 3D 到 2D 成像参数来提取舞蹈的层次结构。我们在多人跟踪和通过 LSTM 网络识别舞蹈类型方面优于现有的 3D 姿势估计 - ICLR提高城市气象污染预测的对抗自编码器和对抗 LSTM
本文利用深度学习中的对抗训练方法,尤其是 PCA-based 对抗自编码器和 LSTM 网络的方法,提高了城市空气污染 CFD 模拟的预报精度。
- ICMLRNN 和 LSTM 是否具有长期记忆力?
该论文讨论了 RNN 和 LSTM 是否具有长期记忆能力,并从统计学的角度证明它们不具备长期记忆能力,并引入了一种新的定义,要求模型权重以多项式速率衰减,最终通过将 RNN 和 LSTM 转换为长期记忆网络来证实我们的理论,该新模型在各种数 - 一种计算高效的全页离线手写文本识别流水线方法
本文介绍了一个 less computationally expensive 的全页手写文本识别框架,其中包括使用对象检测神经网络定位手写文本并使用多尺度 CNN 提取特征,然后将其输入到双向长短期记忆网络进行文本识别。该框架使用更少的内存 - 基于时空关注模型的情境感知行人轨迹预测
本文提出了一种基于时空图的长短期记忆神经网络,用于在拥挤环境中预测行人的轨迹,考虑与场景中的静态和动态元素的交互,结果表明,相比于其他方法,本方法在人类轨迹预测方面能够将平均位移误差(ADE)和最终位移误差(FDE)分别降低高达 55%和 - CVPRAdaFrame:快速视频识别的自适应帧选择
AdaFrame 是一种通过 LSTM 网络和全局内存来为视频识别自适应选择相关帧的框架,通过策略梯度等方法来训练,用于生成预测和确定下一个帧,并计算查看更多帧的效益,并利用预测结果来实现自适应前瞻推断,从而减少计算成本并保持精度,通过大规 - EMNLP利用胶囊网络实现线性时间神经机器翻译
本研究使用动态路由的胶囊网络对线性时间神经机器翻译进行了调查,并提出了一种更加灵活的选择,表示和聚合源句子的部分 - 整体信息的方法。在英德任务和英法任务中,该方法与最先进的神经机器翻译系统获得了可比较的结果。这是关于胶囊网络在序列到序列问 - 从语音生成说话脸部标记
本文介绍了一个能够从声学语音中实时生成说话人脸关键点的系统,该系统使用一个 LSTM 网络进行训练并能够在不同说话人和话语上进行产生。
- AAAISkipFlow: 将神经连贯特征纳入端到端自动文本评分
提出了一种基于 Deep Learning 的新型神经架构,通过建立 SkipFlow 机制在多个时序快照之间建立显性的语义关系,形成一种辅助神经内聚特征,提高了长文本评分的准确性与鲁棒性,同时在 ASAP 数据集达到了最新的表现。