- 探究神经网络语音模型中自动语音识别系统所编码的信息
通过神经网络的层级表达,在多个任务中评估自动语音识别声学模型的性能变化和目标任务,我们可以推测哪些信息在不同层次的架构步骤中得到强化或干扰。分析结果显示,基于神经网络的声学模型拥有异质信息,似乎与音素识别没有相关性,例如情感、情绪或说话人身 - MM范畴深度学习:架构的代数理论
我们提出了一个关于通用框架,用于指定和研究深度学习架构的难题的见解。我们认为目前为止的关键尝试缺乏一个能够将模型必须满足的约束与其实现进行协调的桥梁。我们的提议是应用范畴论 —— 更具体地说,是参数化映射的范畴论,作为一个单一的理论,优雅地 - 生成万花筒网络
发现深度 ReLU 网络(或多层感知器架构)表现出 ' 过度泛化 ' 现象并利用这一特性设计了数据集炫斑网络,称为 ' 生成炫斑网络 '。此现象在其他深度学习架构(如 CNNs、Transformers 和 U-Nets)中也观察到,并正在 - Re-DiffiNet:利用扩散建模肿瘤分割中的差异
通过使用 DDPM 模型,我们介绍了一种名为 Re-Diffinet 的框架,用于建模分割模型与真实情况之间的差异,从而提高肿瘤分割的 Dice 评分 0.55% 和 HD95 16.28% 的准确性。
- 变化检测实事求是
简单的 U-Net 分割基线模型仍然是用于变化检测任务的最佳性能表现者,无需训练技巧或复杂的架构改变。
- 神经电路图:深度学习架构的通讯、实现和分析的稳健图示
使用神经电路图图示化深度学习架构,展示架构的细节、数据的排列方式以及线性操作的并行行为,并且能够提供数学洞察力和算法的时间和空间复杂度分析。
- 大规模估计局部学习系数
本论文通过在深度线性网络上使用 {t arXiv:2308.12108 [stat.ML]} 中的方法,经验性地展示了如何准确自洽地测量局部学习系数(LLC),并证明了估计的 LLC 具有理论量的尺度不变性。
- 物理感知网络和全天候多模态逆境天气图像融合基准
在这篇论文中,我们提出了一种适用于各种天气条件下的多模态图像融合模型,该模型具有抵抗不同天气干扰的能力,并在极端天气条件下展示出出色的细节恢复和多模态特征提取能力。
- MUSTAN: 面向稳健视频前景分割的多尺度时间上下文注意力
视频前景分割是一项重要的计算机视觉任务,本文利用视频数据中的时空信息和空间线索改进了模型的性能,提出了深度学习架构,并引入了 Indoor Surveillance Dataset 以验证其有效性。
- DeepGI:一个 MRI 扫描中胃肠道分割的自动化方法
该论文介绍了一种切入先进的方法,能够自动化地在磁共振成像(MRI)扫描中分割胃肠道区域。利用先进的深度学习架构,该模型整合了 Inception-V4 进行初始分类,带有 VGG19 编码器的 UNet++ 用于 2.5D 数据,以及 Ed - 探索未知领域:理解层调整对图像分类的影响
研究调整深度学习结构对图像分类的模型性能产生的影响,发现图像处理管道中的滤波操作是关键,图像处理前的滤波效果更好;层的选择和顺序以及滤波器放置方式对模型性能有显著影响,这项研究为优化深度学习模型提供了有价值的见解,未来的研究可以着重在协作平 - 自监督视频面部情感感知器(SVFAP)
基于视频的面部情感分析是人机交互中扮演重要角色且最近引起了广泛关注。该研究主要集中于发展各种深度学习架构,并以全监督方式进行训练。然而,由于长期欠缺大规模高质量的标记数据,这些监督方法的进一步改进受到严重的阻碍。为了解决这一困境,本文引入了 - AAAI小波动态选择网络在惯性传感器信号增强中的应用
在这篇论文中,我们提出了一种智能选择适当的小波基函数来处理不同惯性信号的小波动态选择网络 (WDSNet)。同时,我们还提出了一种类别表示机制 (CRM),用于从输入数据中提取和表示类别特征。通过实验证明,这一增强的惯性信号在轨迹重建等方面 - 时空线性:面向通用多元时间序列预测
复杂多元时间序列预测中,通过简单的线性模型结构来整合时间嵌入和空间信息的 SpatioTemporal-Linear 框架优于深度学习技术中的线性模型和 Transformer 模型在多种观测和预测时长的数据集上的性能表现。
- 基于图像的时间序列数据表示:脑电图伪迹检测的比较分析
提出了利用 EEG 数据作为时序数据的基于图像的数据表示方法的测试平台,并对六种常用的表示方法进行了十一种流行的深度学习架构的评估。发现在表示方法的选择中,存在着偏差与方差之间的权衡,然而某些表示方法在突出增加数据的信噪比方面更加有效。通过 - 具有统计质量保证的调整数据合成
通过引入一种基于置信度的数据合成算法,该算法通过对 Conformal Prediction 框架进行新的扩展,为模型输出提供统计置信度保证,并通过理论证明和对五个基准数据集的广泛实证评估来支持我们的算法。在面对低样本数、类别不均衡、不可分 - Transformer 能否表示卡尔曼滤波器?
使用 Transformer 实现卡尔曼滤波,该方法可以近似卡尔曼滤波器并且可以用于测量反馈控制,实现与标准最优控制策略相近的性能。
- 文本情感分类的标签平滑优化
这项研究通过使用不同程度的平滑化技术来实现情感分类的标签平滑化,从而提高情感分类准确性,并在八个不同的数据集和深度学习架构(TextCNN、BERT 和 RoBERTa)中的训练和微调两种学习方案下,通过大量实验展示了标签平滑化在文本情感分 - 全球连接神经网络
深度学习架构的性能下降问题,以及 GloNet 架构作为传统架构 ResNets 的一个强有力的替代方案。
- Tiny-VBF: 基于 Vision Transformer 的轻量级超声单角度平面波成像低资源波束形成器
利用深度学习架构来加速超声成像中的计算密集型非实时波束形成算法近来愈加受到关注。然而,现有最先进的深度学习技术的复杂性对于资源有限的边缘设备的部署提出了挑战。本文提出了一种基于视觉转换器的微型波束形成器 (Tiny-VBF),它使用通过单角