- 自动驾驶车辆中的驾驶员 / 乘客看向预测接管准备
本研究提出了一种基于可观察信号的驾驶员接管准备度的数据驱动方法,使用自动驾驶汽车上的空间视觉感知器,通过主体评级建立驾驶员接管准备度的可观测度指标(ORI),并借助 LSTM 模型连续估计驾驶员的 ORI。
- 电子健康记录出院记录的摘要生成
使用 LSTM 模型标记当前病历的主题,从而通过自动摘要有效地协助医生完成患者总结,提高医疗决策的效率,并减少医疗错误。
- MM基于 LSTM 和部首嵌入的古汉语句子分割
本文提出了基于偏旁部首的低维特征嵌入方法,配合 LSTM 模型用于古代汉语文本的句子分割,实验结果表明,相较于已有方法,在汉文句子分割上取得了更好的效果,尤其是唐代碑文的处理。
- 双向 LSTM 在中文分词中的最新进展
在中文分词任务中,与更复杂的神经网络模型相比,双向 LSTM 模型结合标准深度学习技术和最佳实践能够在许多流行数据集上实现更好的精度。此外,错误分析表明,对于神经网络模型而言,词汇外的单词仍然具有挑战性,其余错误不太可能通过架构更改来修复, - COLING基于注意力机制的 LSTM 模型用于检测攻击性
本文描述了 Nishnik 团队的系统在 Facebook 帖子和评论的侵略性识别中的成果,其采用 LSTM 模型和 attention unit,在 Facebook 评论和社交媒体数据的 Hindi 子任务中排名第 4 和第 6,相应的 - 一种用于印地语 - 英语混合编码数据情感分析的集成模型
本研究提出了基于字符三元组 LSTM 模型和基于词元素的多项式朴素贝叶斯 (MNB) 模型的集成模型,用于识别印地语 - 英语 (Hi-En) 混合数据的情感极性,实验结果表明,相较于几个基准和其他基于深度学习的提出的方法,我们的方法在真实 - 基于深度神经网络生成网络流行文化模因
本研究介绍了一种新颖的模因生成系统,该系统可根据给定的任何图像产生幽默而相关的字幕,并且还可以被调节到用户自定义的与模板相关的标签。系统使用预训练的 Inception-v3 网络返回进行字幕生成的图像嵌入,通过基于注意力机制的深度 LST - 基于机动 LSTM 的多模态环境车辆轨迹预测
本文针对自动驾驶汽车在复杂交通情境下进行安全高效的行驶所需的需求,提出了使用 LSTM 模型来进行交互式的运动预测,并在 NGSIM US-101 和 I-80 数据集上与其他方法进行了比较和分析。
- WWW网络上的社群互动与冲突
本研究考察了网站 Reddit 上 36,000 个社区之间的互动和如何导致冲突和负面互动。研究者发现少数社区 (小于 1%) 导致了 74% 的冲突,而冲突往往由高活跃度的社区成员开始,但由低活跃度的成员执行。冲突导致了 “回声室” 的形 - 通过对深度预测模型的对抗攻击识别医疗记录中易感的位置
本文提出了一种基于深度神经网络的电子病历的快速筛查框架,该框架可用于识别易受攻击的医疗记录事件并防止其被改变。
- ACL关于医学影像报告的自动生成
研究了医学影像的自动生成报告问题,提出了多任务学习框架、注意力机制和递归神经网络以解决标签预测、异常区域定位和长段落生成等难点问题,并在两个公共数据集上进行了验证。
- 指针哨兵混合模型
本论文介绍了神经序列模型中的指针标志混合结构,其在语言建模领域取得了最先进的性能,并针对更现实的词汇和更大的语料库引入了可用的 WikiText 语料库。
- RETURNN:RWTH 可扩展通用循环神经网络训练框架
本文介绍了一种可扩展和易于配置的神经网络训练软件,该软件提供了丰富的功能层,特别关注在多个 GPU 上高效训练循环神经网络拓扑结构。该软件支持灵活配置,可用作框架或独立工具,能够训练最先进的深度双向长 - 短时记忆(LSTM)模型,并且已被 - 分层深度时间模型用于群体活动识别
本文针对视频序列中的团体活动行为分类问题,基于 LSTM 模型构建了一个 2 阶段的深度时间模型,同时考虑了个体和群体层面的动态信息,通过在排球视频数据集上的实验验证了该模型的有效性。
- CVPRVisual7W:基于图像的问答系统
通过物体级别的 grounding,在图像中建立了文本描述与图像区域的语义联系,提出了一种新型维度的视觉问答任务,并使用多个基线模型和带有空间注意力机制的 LSTM 模型来解决该任务。