- 南非鸟类物种的自动生物声学监测在未标记数据上
基于被动声学监测(PAM)录音进行生物多样性监测的分析既耗时又受到录音中背景噪声的挑战,现有的声音事件检测(SED)模型仅适用于特定的鸟类物种,进一步模型的发展需要标记数据。本研究开发的框架从可用平台自动提取选定鸟类物种的标记数据,将标记数 - 利用视觉监督进行基于阵列的主动说话人检测和定位
通过用从多通道音频中提取的空间输入特征进行训练的简单音频卷积循环神经网络(CRNN),可以独立于视觉模态进行同时水平活动说话者检测和定位(ASDL),超越典型的音频 - 视觉方法的性能并产生竞争性结果的成本昂贵的传统监督式训练。
- 使用卷积循环网络和优化技术的心脏 MRI 重建
研究提出了一种卷积递归神经网络(CRNN)架构,用于利用时间相关性在监督影像的心脏磁共振成像重建中。该模型结合了单图像超分辨率细化模块,相比于普通 CRNN 的实现,其在结构相似性和标准化均方误差方面,使单线圈重建提高了 4.4%和 3.9 - 使用话语协调特征和分层注意力文本嵌入的多模式抑郁症分类
使用从语音识别工具中提取的语音道变量和文本转录中的发音协调特征开发了一种多模式抑郁症分类系统,并使用分段分类器和多级卷积递归神经网络获得了性能提升,同时还通过结合会话级音频模型和 HAN 文本模型开发了一种多模态系统。
- 基于图像时间序列的作物分类映射:使用多尺度标签层次结构的深度学习
本文旨在通过分类卫星图像时间序列来绘制农作物的地图,开发了一种利用专家知识的农作物分类方法,并将三级标签层次结构编码至卷积循环神经网络中,该神经网络能够同时学习罕见珍贵类别在更宏观层次上的特征表示,提高了细粒度分类的性能,并能够根据置信度和 - CVPR基于事件的动态模糊矫正学习
本文提出了一种基于事件相机的深度学习方法,通过卷积循环神经网络和可微分方向事件过滤模块整合全局和局部尺度的视觉和时态知识,提取边界先验信息,从而达到了恢复运动模糊图像的最佳质量,适用于真实世界的运动模糊问题。
- 针对并发对话行为识别的长距离上下文建模
本文主要研究了如何使用卷积 - 循环神经网络对对话中的连续性行为进行识别,解决了当前对于长篇对话和复杂对话情境下预测难度较大的问题,同时在技术论坛数据集上取得了更为优异的效果。
- 声音事件定位和检测的多房混响数据集
本文介绍了用于 DCASE2019 挑战赛的 “声音事件定位与检测”(SELD)任务设置及其基准方法。使用卷积循环神经网络实现了基准方法,对含混响的数据集进行了评估。
- MM音频场景分类的时空注意池化
本文提出了一种基于卷积递归神经网络的时空关注池化层,用于学习判别性模式并抑制与声学场景分类无关的模式。实验证明该方法不仅优于强卷积神经网络基线,还在 LITIS Rouen 数据库上取得了新的最优性能。
- 使用文本段落的深度学习预测年度报告中的问题
研究开发了一种利用公司年度报告中的非结构化文本数据(包括审计报告和管理声明)的卷积循环神经网络模型,可用于公司困境预测,并发现该模型增强了困境预测表现,特别是对于大型公司。
- 利用多标签多任务卷积循环神经网络统一独立和重叠音频事件检测
论文提出了一种基于卷积循环神经网络的多标签多任务框架,可以同时检测单个和重叠音频事件,并具备有效的特征提取、事件分类和边界定位能力,并使用三个不同的序列损失函数对网络进行训练,在两个数据集上的实验结果表明模型具有良好的泛化性能。
- 卷积循环神经网络用于动态磁共振图像重建
提出了一种新颖的卷积循环神经网络(CRNN)结构,通过联合利用时间序列的依赖性和传统优化算法的迭代性质,从高度欠采样的 k 空间数据中重建高质量的心脏 MR 图像,同时学习时空相关性,优于当前 MR 重建方法在计算复杂性、重建准确性和速度方 - 使用深度卷积循环神经网络进行语言识别
该论文提出了基于图像领域解决 LID 问题的模型,使用了混合的卷积循环神经网络技术对提供的音频片段的频谱图像进行分析,并在广泛的实验中证明了模型的应用性,能够轻松地扩展到以前未知的语言,同时保持其分类准确性。
- ICLR扩散卷积循环神经网络:基于数据的交通预测
本文提出了一种用于交通预测的新型深度学习架构 Diffusion Convolutional Recurrent Neural Network (DCRNN),通过在有向图上进行双向随机游走来捕捉交通流的空间依赖性,通过编码器 - 解码器结 - 利用空间特征和卷积循环神经网络进行声音事件检测
本文提出使用从多通道音频中提取的低级空间特征进行声音事件检测,通过初始阶段从每个通道中单独学习这些多通道特征,扩展了卷积递归神经网络以处理更多类型的这些特征,并表明将特征呈现为体积的单独层,而不是将每个通道的特征串联成单个特征向量,可以更好 - CRNN:一种用于冗余检测的联合神经网络
本文提出了一种新的框架,用于检测监督句子分类中的冗余。我们的模型结合字符感知卷积神经网络(Char-CNN)和字符感知循环神经网络(Char-RNN)形成卷积循环神经网络(CRNN)。我们比较了我们的框架与四个流行基准语料库上的最先进的文本 - 卷积循环神经网络用于音乐分类
本研究引入了一种卷积循环神经网络(CRNN)进行音乐标记。研究中对比了使用 CNN 的三种不同结构来进行音乐标记的性能和每个样本的训练时间,并表明相对其他模型,CRNN 具有更好的效果和更少的参数和更快的训练时间, 表明其混合结构在音乐特征