- LMBF-Net: 一种用于多特征分割的轻量级多路径双向焦点注意力网络
本研究提出了一种用于多特征分割的多路径卷积神经网络,该网络轻量且对信息敏感。通过基于图像块的实现提取局部图像特征,并在编码器和解码器之间引入焦点调制注意力块以改善分割效果。使用滤波器优化来防止滤波器重叠并加速模型收敛。通过卷积操作和组卷积操 - 推进边界:专注于深度配置性能学习
通过系统文献综述和实证研究,本论文提出了深度学习技术在配置性能建模方面的知识缺口,并通过比较编码方案、提出稀疏性鲁棒框架 DaL 和顺序元学习框架 SeMPL,显著提高了性能预测的准确性。
- 医学图像分类的联邦蒸馏:走向可靠的计算机辅助诊断
本论文提出了一种基于联邦学习的隐私保护医学图像分类框架 (FedMIC),通过全局和局部知识使医疗组织从私有数据中获得定制模型,同时减少通信开销和提高效率,提高在资源受限条件下的稳健性和实际适用性。通过使用四个公共医学图像数据集展示了 Fe - SolarSAM: 基于分段任意模型 (SAM) 和遥感技术的新兴城市建筑规模光伏潜力评估
利用遥感图像和深度学习技术,本研究引入了一种新颖的建筑一体化光伏评估方法 SolarSAM,并利用中国北方的一个新兴城市验证了该模型性能。评估结果显示,建筑一体化光伏的年发电潜力超过了该城市的总用电量的 2.5 倍,揭示了未来建筑一体化光伏 - 面向稳健自主降落跑道检测的联合对抗学习
在本文中,我们提出了一个基于联邦对抗学习的框架来检测着陆跑道,通过清洁本地数据和对抗版本的配对数据。我们的实验结果表明,这种联邦对抗学习方法在面对对抗攻击时表现出良好的性能。
- VigilEye:基于人工智能的实时驾驶员疲劳检测
本研究提出了一种新的司机瞌睡检测系统,结合了深度学习技术和 OpenCV 框架,利用从司机脸部提取的面部标志作为卷积神经网络的输入,训练模型识别瞌睡模式,并集成 OpenCV 实现实时视频处理,从而使该系统适用于实际应用。广泛的实验证明该系 - IJCAI由卫星影像生成道路网络以获取贫困地区的社会经济洞察
通过结合编码 - 解码架构和卫星图像的形态学运算,我们开发了一个系统的道路提取框架,为跨学科研究人员提供了一种集成的工作流。在贫困地区的实际数据上进行的道路网络提取的大量实验证明,相比于基准方法,F1 得分提高了 42.7%,重建了大约 8 - T-JEPA:轨迹相似度计算的联合嵌入预测架构
本文介绍了 T-JEPA,一种利用 Joint-Embedding Predictive Architecture(JEPA)进行自监督轨迹相似性计算的方法,通过在表示空间中对轨迹信息进行采样和预测,使模型能够推断轨迹的高级语义缺失部分,无 - 多分辨率互学习网络用于多标签心电图分类
本论文提出了一种多分辨率相互学习网络(MRM-Net),通过双重分辨率注意力架构和特征互补机制处理心电图(ECG)信号,以提高多标签 ECG 分类性能。
- 深度学习系统的安全弱点和漏洞
通过对 AI 软件系统中深度学习技术的脆弱性进行系统研究,我们提出了一个两流数据分析框架,探索各种数据库中的脆弱性模式,并进行了大规模实证研究来理解脆弱性的模式和修复中的挑战,以推进安全的深度学习系统的发展。
- CarbonSense:碳通量建模的多模态数据集和基线
通过使用统计技术从生物物理数据中预测碳通量,世界上第一个机器学习准备就绪的数据集 CarbonSense 整合了全球 385 个地点的测量碳通量、气象预测因子和卫星图像,提供了全面的覆盖并促进了模型训练,同时通过提供基准模型和新的基于 Tr - 水下声学相机图像的自监督去噪策略
本文介绍了一种使用深度学习技术对声学相机图像进行去噪的新策略,该策略由两个主要组件组成:自监督去噪框架和精细特征引导块。实验结果表明,该去噪策略可以有效过滤声学相机图像,而不需要先验的噪声模型。去噪过程几乎是端到端的,无需复杂的参数调整和后 - ECG 复杂划分的自学模型
本文介绍了一种针对心电图(ECG)划分的新方法,通过伪标记未标记的数据并使用我们的数据集进行训练,从而改善 ECG 划分的预测质量,揭示了该数据集对训练稳健模型的价值。
- 外汇市场多智能体异步分布的交易优化深度强化学习方法
这项研究开创性地应用了多智能体强化学习(MA RL)框架与最先进的异步优势演员 - 评论家(A3C)算法,结果表明此方法可以更广泛和更快地探索不同的货币对,显著提高交易收益。此外,代理可以在较短时间内学习到更有利可图的交易策略。
- LSTM-COX 模型:处理循环事件的简洁高效深度学习方法
通过结合长短期记忆网络(LSTM)和 Cox 模型分析复发事件中动态时间信息以增强模型性能,本研究在临床风险特征提取方面显著提高准确性,同时在模拟数据集上保持良好性能,有效地区分高低风险患者组,在实际膀胱癌复发数据上取得了较高的一致性指数, - PRFashion24:波斯语时尚产品评论情感分析数据集
该研究使用深度学习技术,特别是长短时记忆网络(LSTM)和双向 LSTM 与卷积神经网络(BiLSTM-CNN)的组合,对波斯语的 PRFashion24 数据集进行情感分析,结果显示积极情绪占主导地位。
- 增强人机交互的触觉手势识别技术进展
本研究旨在提出一个强大的触觉手势识别系统,通过对各种手势识别方法进行综合评估,包括传统的特征工程方法和能够实时解释各种手势的当代深度学习技术,以适应手的大小、运动速度、施加压力水平和交互点的变化,我们对各种方法的深入分析为人机交互领域的基于 - M2ANET:移动疟疾注意力网络用于高效分类血细胞中的疟原虫
通过结合 MBConv3 和改进的全局 MHSA 机制,我们设计了 M2ANET 模型,用于在血细胞图像中高效分类疟原虫,通过对基准测试的广泛实验,我们证明了 M2ANET 在准确性和效率方面优于一些先进的轻量级和移动网络,同时讨论了 M2 - 可解释的少样本知识追踪
基于大型语言模型的认知引导框架可在少量学生记录的情况下追踪学生的知识,并提供自然语言解释。实验结果显示,大型语言模型可与竞争性深度知识追踪方法相当或更优。
- 基于令牌化的马巴模型中的中央化马巴交叉扫描用于高光谱图像分类
利用创新的 Mamba-in-Mamba (MiM) 架构和利用 State Space Model (SSM) 的首次尝试,本研究提出了用于高光谱图像分类的 MiM 模型,通过改进的特征生成和集中方法以及改进的解码效率,优于现有基线和最先