- 平流增强卷积神经网络
通过在卷积神经网络中引入对流,以及使用反应扩散神经元组件构建一个模拟反应 - 对流 - 扩散方程的高维网络,我们提出了一个物理上启发的体系结构来解决物理科学中基于时空序列的预测问题,并展示了该网络在一些时空数据集上的有效性。
- 基于横向数据集和横向疾病通用化的视网膜血管分割模型基准评估
视网膜血管分割是通过眼底图像提取临床相关信息的方法。我们在迄今为止最大的公开数据集上为文献中常用的各种架构和训练选择提供了严格的基准,并评估了五个已发布的模型在公开可用的 FIVES 眼底图像数据集上的性能,同时比较了不同模型架构在不同损失 - 模糊卷积神经网络用于表格数据分类
本研究通过提出的模糊卷积神经网络(FCNN)模型对表格数据进行分类,通过实验证明该模型在学习有意义的表征方面表现出竞争性或优越性能,为结构化数据分析提供了新的机会。
- DGMamba: 通过广义状态空间模型实现域泛化
该研究提出了一种名为 DGMamba 的新型域泛化框架,具有对未知领域的强大普适性和全局感受野以及高效的线性复杂度,通过引入 HSS 和 SPR 两个核心组件来改进分布偏移问题;其中,HSS 减少了与特定领域特征相关的隐藏状态对输出预测的影 - 使用 CNN-LSTM 简洁建模进行水流预测
在这项研究中,我们将 CNN-LSTMs 的应用扩展到时间序列设置中,利用滞后的水流数据与降水和温度数据相结合,预测水流状况,并在内布拉斯加州的 32 个 HUC8 流域中的 21 个流域中取得了显著的预测性能改进,展示了 Kling-Gu - 基于 VGG16 和 VGG19 的迁移学习模型用于皮肤癌诊断
皮肤癌是世界上最危险和最常见的癌症之一,本文使用深度卷积神经网络和迁移学习方法对皮肤病变进行自动分类,证明了在已有预训练神经网络的基础上的合理设计和应用可以显著提高病变检测的分类准确率。
- 激活图像超分辨率中更广阔的区域
本文介绍了使用 Vision Mamba 模型在单图超分辨率 (SISR) 领域中提高性能的方法,并通过引入 MMA 网络的综合实验分析验证了其竞争力和灵活性,鼓励在图像处理领域中进一步探索利用状态空间模型的潜力。
- 显著性感知的自动佛像识别
基于显著性图采样的端到端自动佛像识别模型在佛像数据集上验证,并在 Top-1 准确率上平均超过先进网络 4.63%,同时只略微增加乘加操作。
- 利用轨迹图像的深度学习对飞机降落时间进行预测
使用基于轨迹图像的深度学习方法预测航空器降落时间,实验结果表明通过集成保持特征提取方法,平均绝对误差(MAE)可以从 82.23 秒降低到 43.96 秒,同时达到 96.1%的平均准确率,其中 79.4%的预测误差小于 60 秒。
- 基于数据流推理加速器的侧信道分析揭示 CNN 体系结构
通过利用卷积神经网络模型结构的空间和时间数据复用,以及架构提示信息,提出一种利用存储器侧通道信息来恢复数据流加速器中卷积神经网络模型结构的攻击方法。实验结果表明,该侧通道攻击可以恢复流行的卷积神经网络模型 Lenet、Alexnet 和 V - 使用 Pix2Pix GANs 进行图像去噪的恶劣天气下人群计数
采用 Pix2Pix 生成对抗网络来去噪众包图像,以提高视觉众包计数模型在恶劣天气条件下的性能表现和准确度。
- FRS-Nets:傅立叶参数化旋转和尺度等变网络用于视网膜血管分割
通过构建傅立叶参数化的 FR-Conv(旋转和缩放等变)卷积操作符,来在卷积神经网络中嵌入更多的等变性,用于视网膜血管分割,实现对精确度的要求,并在公共数据集上进行全面实验验证,结果表明 FRS-Nets 在参数量约为基线模型的 13.9% - 深度学习模型实现的血细胞分类
人体血液细胞分类对于疾病识别至关重要,通过使用卷积神经网络和迁移学习技术,本研究提出了一种新的基于卷积神经网络的框架,成功实现了对血液细胞的准确分类,并在所采用的数据集上达到了 99.91% 的准确率。
- 强透镜识别神经网络的选择功能
通过使用不同训练数据集和三个代表性网络,我们发现卷积神经网络在选择镜引力透镜系统时具有偏倚,并且偏好具有较大的爱因斯坦半径和更集中的源光分布,这一选择函数对于所有神经网络都是普遍适用的。
- 物理启发的时空图 AI 集合体用于引力波探测
本文介绍使用混合卷积神经网络和图神经网络方法来检测引力波的方法,并通过构建 AI 模型在多个检测器上实现了令人满意的表现。
- TEC-Net: 视觉 Transformer 集成卷积神经网络用于医学图像分割
本研究采用混合卷积神经网络和 Transformer 的混合结构,提出了一种具有自适应特征提取能力和具有全局信息建模的方法,用于医学图像分割。实验结果表明,该方法比现有的方法具有更好的医学图像分割结果。
- Patch-DrosoNet: 基于果蝇启发模型的图像划分分类,用于轻量级视觉地点识别
本文提出了一种针对 DrosoNet 的新型训练方法,其中在参考图像的不同区域上训练不同的模型,以便让它们专门处理该特定部分的视觉特征。此外,我们还介绍了一种类卷积预测方法,每个 DrosoNet 单元为查询图像的每个部分生成一组位置预测, - 深度卡尔德隆电阻抗成像方法
本研究针对现有方法进行了改进,从而提出了一种复杂阻抗层析成像技术,该技术通过使用卷积神经网络对成像结果进行后处理,以改善成像的分辨率和准确性。实验结果表明,该方法能够显著提高标准 Calderón 方法的性能。
- LCDnet:用于实时视频监控的轻量级人群密度估计模型
本文提出了一种轻量级人群密度估计模型(LCDnet)和一个改进的训练方法(CL),并在无人机视频监控中实现了实时计数;实验结果表明,LCDnet 在一定范围内准确性较高,同时显著降低了推理时间和内存需求,可以在计算资源非常有限的边缘设备上部 - AAAIDeMT: 变形混合变压器用于密集预测的多任务学习
本研究提出了一种利用可变形卷积神经网络和基于查询的 Transformer 相结合的多任务学习模型,名为 DeMT,该模型在进行密集预测方面使用更少的 GFLOPs,并且在多项指标上明显优于当前的基于 Transformer 和 CNN 的