- CVPR流媒体视频模型
提出了一种名为 “Streaming Vision Transformer” 的流式视频架构,利用具有内存功能的时间感知空间编码器产生帧级特征,供基于帧的视频任务使用;然后将帧级特征输入到与任务相关的时间解码器中,获得用于序列化任务的时空特 - 基于几何感知的高效文本识别
本文介绍用于场景文本识别的深度学习架构 GeoTRNet 的概念、理论、实现及实验结果,该架构专用于处理常规场景文本,只使用几何特征识别图像中的数字,具有优异的模型可部署性、数据隐私性、模型可靠性,同时具有最小化模型权重、更短的推理时间等优 - 预想语音识别的脑电波频带分析
本文考虑使用 EEG 信号来实现想象中说出的话的识别,并对不同频带和大脑不同区域的信号进行分析,使用包含卷积神经网络(CNN)和长短时记忆网络(LSTM)的时空深度学习架构,在数字、字符和图像三个分类任务中获得了较高的分类准确性,其代码已在 - 基于分层时空图神经网络的手语翻译
该论文提出了一种新颖的用于手语翻译的深度学习体系结构,称为分层时空图神经网络,在高层和细节层次上建模手语,并使用图卷积和图自我注意机制来描述局部和全局信息特性,并在基准数据集上进行了实验验证。
- MM基于 GP-WGAN 和增强 Faster R-CNN 的稀有缺陷自动视觉检测框架
本文提出了一种基于深度学习的两阶段故障诊断框架,第一阶段通过数据扩增增强图像处理性能,第二阶段则使用改进后的深度学习架构进行对象检测,在两个多类别数据集上的实验结果表明,该框架优于其他解决方案。
- 透过皮肤看世界:利用新型视触感传感器识别物体
本文介绍一种新的基于视觉的传感器,并结合高分辨率触觉发射,以统一的硬件和计算体系结构进行处理;该传感器在多模式物体识别和计量方面表现出良好效果,并且在触觉和视觉领域上具有重要的物理含义,数据验证了其能力可以从深度学习视觉和触觉结合的角度对家 - 大规模生物医学命名实体识别
通过在 Apache Spark 之上重新实现 Bi-LSTM-CNN-Char 深度学习架构,我们提出了一个单可训练的命名实体识别(NER)模型,该模型在七个公共生物医学基准测试中获得了新的最优结果,而不使用像 BERT 这样的重型上 - 贝叶斯三维手部姿态估计的主动学习
本文提出了一种基于贝叶斯近似的深度学习框架用于 3D 手势估计,通过该框架提取数据或者学习能力两种不确定性,与基准估计方法相比得到了更好的效果,并应用于主动学习应用中,采用新式获取函数,使用最小量数据得到了最低误差。
- KDD深度主动推断用于部分可观测的马尔可夫决策过程
本文介绍了一种基于 Deep Active Inference 的深度学习架构,结合 Variational Autoencoder 编码连续状态表示,可以直接从高维感觉输入中学习成功策略,并在 OpenAI 基准测试中证明其与深度强化学习 - SDCT-AuxNet$^θ$: DCT 增强染色去卷积 CNN 附加分类器用于癌症诊断
本文提出了一种新的深度学习体系结构,以分类 ALL 癌细胞图像,并利用卷积神经网络和核 SVM 多模块框架进行预测,并在公共数据集上获得了最佳的加权 F1 得分。
- GLAD:学习稀疏图恢复
本文提出了一种基于深度学习的方法(GLAD),通过交替极小化算法及监督学习,实现从数据中恢复稀疏条件独立图的目标,为解决数据驱动方案中矩阵的正定性和稀疏性不易保证及参数量大等问题提供了一种有效的模型思路。
- 深度尺度空间:尺度等变性
介绍了深度尺度空间 (DSS),一种卷积神经网络的推广,利用传统图像识别任务的尺度对称结构。在构建尺度等变的互相关基础上,可以在几乎任何现代深度学习架构中以即插即用的方式使用。通过应用于 Patch Camelyon 和 Cityscape - KDDCASTNet: 基于社区关注的时空网络,用于阿片类药物过量预测
利用实时犯罪动态预测阿片类药物过量,并提出基于区域群组的深度学习架构,它能够自适应地优化位置预测,为预防阿片类药物过量提供有意义的解释。
- 点云识别的离散旋转等变性
该论文提出了一种深度学习架构,能够在点云识别中实现离散的 SO(2)/SO(3)旋转等变性,通过消除置换并进行操作,提升了任何现有点云网络的性能,并在各种旋转下,展示了分类任务的最新成果。
- DeepSpline: 参数曲线和曲面的数据驱动重建
本文提出了一种基于深度学习架构的样条拟合方法,可以用于根据图像或点云输入重构几何图形,与传统的基于样条的方法相辅相成。
- CVPR运动融合框架:手势识别数据级融合策略
本文提出了一种数据层次的融合策略 Motion Fused Frames(MFFs),以将动作信息融合到静态图像中,从而更好地代表动作的时空状态。该策略可以作为任何深度学习架构的输入,具有很少的网络修改量,并在三个视频数据集上进行评估,取得 - EMNLP比较、压缩和传播:利用对齐因式分解增强神经体系结构用于自然语言推理
本文提出了一种新的深度学习架构来进行自然语言推理,并且采用因子分解层来提高表征学习的效率。实验表明,该架构在三个常用评估基准上取得了出色表现,并且可以实现轻量级参数化。此外,我们的可视化分析表明,我们的传播特征是高度可解释的。
- NIPS神经母细胞瘤预测分类的多目标深度学习方法
使用深度学习架构 CDRP 并结合高通量转录组数据进行诊断和预测,优于临床算法对于神经母细胞瘤的预后,为正确的肿瘤治疗策略提供了重要的分析依据。
- ICCV使用深度神经网络进行高分辨率形状补全,进行全局结构和局部几何推断
本文提出一种基于深度学习架构的数据驱动方法来恢复三维形状的缺失部分,该方法包含全局结构推断网络和局部几何细化网络,并在六个实体类别上进行了定性和定量评估,表明优于现有的形状完成工作。
- CVPR单幅图像深度联合雨滴检测与去除
本文提出了一种基于深度学习架构,通过新的雨画像模型解决单幅图像中存在大雨和雨斑累积的雨滴去除问题,并通过使用二进制雨斑图和重复的雨检测实现更好的效果。