- 标签平滑的行动预测知识蒸馏
本研究提出了一种基于 LSTM 网络的多模态框架,用于捕捉和模拟多标签的行动预测问题,并引入标签平滑的概念,以提高机器人技术在人机交互、辅助生活和自动驾驶等领域的预见性。
- CVPRSR-LSTM: 面向行人轨迹预测的 LSTM 状态细化
本研究提出了一种基于 SR-LSTM 的数据驱动状态细化模块,通过消息传递机制激活邻居的当前意图,并共同迭代地完善人群中所有参与者的当前状态,有效提取邻居的社交效应,实现了对于行人轨迹预测的良好效果。
- NIPS出租车需求供给预测:空间划分对神经网络性能的影响
本文探讨了适当选择网格化策略对于时空出租车需求供给建模框架的重要性,并使用印度孟买和美国纽约的出租车需求供应 GPS 数据比较了变尺寸多边形基础的 Voronoi 网格和固定尺寸的 Geohash 网格。通过使用 LSTM 神经网络模型,将 - 基于对话背景的讽刺分析
研究了在社交媒体中检测讽刺语境下的对话背景、LSTM 网络、不同平台之间差异对结果的影响以及定位句子语气的研究,通过定量分析和注意力机制判别出实验结果优于人工标注。
- 循环神经网络(RNN)和长短时记忆网络(LSTM)的基础知识
该论文旨在通过从信号处理中提取概念,正式导出经典的 RNN 公式,揭示 LSTM 系统的组成部分,并将 RNN 转换为 Vanilla LSTM 网络,以便于理解和实现。在此基础上,作者提出了基于 Vanilla LSTM 的最新扩展,适合 - MM通过实验计算梯度:使用 LSTM 和记忆近端策略优化进行黑盒量子控制
本文介绍了黑盒量子控制作为一个有趣的强化学习问题在机器学习领域的应用,并分析了在量子物理中出现的强化学习问题的结构,提出了通过受随机策略梯度训练长短期记忆(LSTM)网络进行参数化的代理,提供了解决这些问题的一般方法,引入了一种基于此分析的 - 网络互动中对话背景在讽刺检测中的作用
该研究通过研究社交媒体讨论发现,长短时记忆神经网络(LSTM)的不同类型能够更好地模拟讨论的背景并更好地识别出含有讽刺意味的回复,进一步使用定性分析方法研究 LSTM 模型的注意力加权效果。
- 从贝叶斯稀疏到门控循环神经网络
本文指出,关于促进稀疏性的更强大的贝叶斯算法具有类似于长短期记忆 (LSTM) 网络或先前设计用于序列预测的替代门控反馈网络的结构,从而导致了一种新的稀疏估计系统,当授予训练数据时,可以在其他算法失败的方案中高效地估计最优解,包括在实际方向 - 用最大池化损失训练长短时记忆网络实现小尺寸关键词定位
提出了一种基于最大池化的损失函数来训练 CPU、内存和延迟需求较低的小型基于关键词识别(KWS)的长短时记忆网络(LSTM)模型。研究结果表明,与交叉熵损失训练的前馈深度神经网络相比,通过使用交叉熵或最大池化损失训练的 LSTM 模型的性能 - 基于深度神经网络的端到端多模态情感识别
本研究提出了一种运用视觉和听觉模态的情感识别系统,其通过深度卷积神经网络提取语音特征,通过 50 层的深度残差网络提取视觉特征,并运用长短时记忆网络进行机器学习算法,通过对 AVEC 2016 情感识别研究挑战的 RECOLA 数据库的自发 - 神经网络的自动课程学习
本篇论文提出了一种新的方法,通过评估学习进程来自动化选择神经网络学习课程,从而最大化学习效率。通过提供来自学习进展指标的信号以激励非静态多臂赌博机算法来的确定随机教学计划。对于 3 个课程上的 LSTM 网络的实验结果表明,我们的方法可以显 - CVPRCERN:用于群体活动识别的置信度 - 能量循环网络
本文介绍了使用一种新颖的深度神经网络结构 ——CERN 来识别人类视频中的个人动作、交互和群体活动,并相对其他现有的 LSTM 结构作出了两个重要的贡献,一个是提出一种新型的能量层(EL)来估计预测能量,另一个是使用最可信的能量最小值而非找 - ACL表情符号是否可预测?
本研究探究了文字和表情符号之间的关系,并使用长短期记忆网络等多种模型预测文本信息所触发的表情符号,而实验结果表明,计算模型比人工能更好地捕捉表情符号的潜在语义。
- 基于 LSTM 的端到端视觉语音识别
本文提出一种基于 LSTM 网络的端到端视觉语音识别系统,同时学习从像素直接提取特征和分类,取得了最先进的视觉语音分类性能。其中包括从口和差异图像中直接提取特征的两个流和通过 Bidirectional LSTM(BLSTM)融合这两个流。 - 走出奥德赛:分析和结合最新洞见以用于 LSTMs
本文提出并分析了一系列的 LSTM 网络改进及修改方式,包括 Monte Carlo 测试时间模型平均、平均池化、残差连接等,以期提高文本分类数据集的性能。经测试发现,这些改进方法可以进一步提高已有的 LSTM 网络的表现。
- EMNLP协调边界预测的神经网络
基于神经网络的模型用于协调边界预测,通过多个 LSTM 网络,并在 Treebank 上进行训练,展示了与两个现有技术的比较,以及在 Genia 语料库上的改进。
- 运用构造情境模型和排序评分融合进行人机交互预测
本文提出了一种使用 LSTM 网络来学习结构化模型和时空模型,包括全局和局部上下文信息,并使用排名得分融合方法来预测双人交互的方法。实验证明,该方法可以显著提高交互预测的精度。
- 关于液体知觉和推理的学习
应用深度学习技术,本文评估了三个模型:单帧网络、多帧网络和 LSTM 循环网络,在检测和跟踪液体方面,实验结果表明 LSTM 网络优于其他两个模型,这表明 LSTM 网络在使机器人具备处理液体的能力上具有潜在的关键作用。
- 使用深度学习进行音乐转录建模和创作
本文采用深度学习方法,具体来说是 LSTM 网络,用于音乐转录建模和创作,使用大约 23,000 个高级词汇(ABC 符号)表示的音乐转录来构建和训练 LSTM 网络,并用其生成新的转录。实际目的是在特定的音乐创作情境中创建有用的音乐转录模 - 基于增量式 LSTM 的对话状态跟踪器
本文提出了一种基于 LSTM 网络,利用自动语音识别假设直接跟踪状态的增量式对话状态跟踪器,并分析 ASR 置信度、包括在训练数据中的转录文本和模型平均等方面对模型性能的贡献。