- 面向稳健自主降落跑道检测的联合对抗学习
在本文中,我们提出了一个基于联邦对抗学习的框架来检测着陆跑道,通过清洁本地数据和对抗版本的配对数据。我们的实验结果表明,这种联邦对抗学习方法在面对对抗攻击时表现出良好的性能。
- VigilEye:基于人工智能的实时驾驶员疲劳检测
本研究提出了一种新的司机瞌睡检测系统,结合了深度学习技术和 OpenCV 框架,利用从司机脸部提取的面部标志作为卷积神经网络的输入,训练模型识别瞌睡模式,并集成 OpenCV 实现实时视频处理,从而使该系统适用于实际应用。广泛的实验证明该系 - IJCAI由卫星影像生成道路网络以获取贫困地区的社会经济洞察
通过结合编码 - 解码架构和卫星图像的形态学运算,我们开发了一个系统的道路提取框架,为跨学科研究人员提供了一种集成的工作流。在贫困地区的实际数据上进行的道路网络提取的大量实验证明,相比于基准方法,F1 得分提高了 42.7%,重建了大约 8 - T-JEPA:轨迹相似度计算的联合嵌入预测架构
本文介绍了 T-JEPA,一种利用 Joint-Embedding Predictive Architecture(JEPA)进行自监督轨迹相似性计算的方法,通过在表示空间中对轨迹信息进行采样和预测,使模型能够推断轨迹的高级语义缺失部分,无 - 多分辨率互学习网络用于多标签心电图分类
本论文提出了一种多分辨率相互学习网络(MRM-Net),通过双重分辨率注意力架构和特征互补机制处理心电图(ECG)信号,以提高多标签 ECG 分类性能。
- 深度学习系统的安全弱点和漏洞
通过对 AI 软件系统中深度学习技术的脆弱性进行系统研究,我们提出了一个两流数据分析框架,探索各种数据库中的脆弱性模式,并进行了大规模实证研究来理解脆弱性的模式和修复中的挑战,以推进安全的深度学习系统的发展。
- CarbonSense:碳通量建模的多模态数据集和基线
通过使用统计技术从生物物理数据中预测碳通量,世界上第一个机器学习准备就绪的数据集 CarbonSense 整合了全球 385 个地点的测量碳通量、气象预测因子和卫星图像,提供了全面的覆盖并促进了模型训练,同时通过提供基准模型和新的基于 Tr - 水下声学相机图像的自监督去噪策略
本文介绍了一种使用深度学习技术对声学相机图像进行去噪的新策略,该策略由两个主要组件组成:自监督去噪框架和精细特征引导块。实验结果表明,该去噪策略可以有效过滤声学相机图像,而不需要先验的噪声模型。去噪过程几乎是端到端的,无需复杂的参数调整和后 - ECG 复杂划分的自学模型
本文介绍了一种针对心电图(ECG)划分的新方法,通过伪标记未标记的数据并使用我们的数据集进行训练,从而改善 ECG 划分的预测质量,揭示了该数据集对训练稳健模型的价值。
- 外汇市场多智能体异步分布的交易优化深度强化学习方法
这项研究开创性地应用了多智能体强化学习(MA RL)框架与最先进的异步优势演员 - 评论家(A3C)算法,结果表明此方法可以更广泛和更快地探索不同的货币对,显著提高交易收益。此外,代理可以在较短时间内学习到更有利可图的交易策略。
- LSTM-COX 模型:处理循环事件的简洁高效深度学习方法
通过结合长短期记忆网络(LSTM)和 Cox 模型分析复发事件中动态时间信息以增强模型性能,本研究在临床风险特征提取方面显著提高准确性,同时在模拟数据集上保持良好性能,有效地区分高低风险患者组,在实际膀胱癌复发数据上取得了较高的一致性指数, - PRFashion24:波斯语时尚产品评论情感分析数据集
该研究使用深度学习技术,特别是长短时记忆网络(LSTM)和双向 LSTM 与卷积神经网络(BiLSTM-CNN)的组合,对波斯语的 PRFashion24 数据集进行情感分析,结果显示积极情绪占主导地位。
- 增强人机交互的触觉手势识别技术进展
本研究旨在提出一个强大的触觉手势识别系统,通过对各种手势识别方法进行综合评估,包括传统的特征工程方法和能够实时解释各种手势的当代深度学习技术,以适应手的大小、运动速度、施加压力水平和交互点的变化,我们对各种方法的深入分析为人机交互领域的基于 - M2ANET:移动疟疾注意力网络用于高效分类血细胞中的疟原虫
通过结合 MBConv3 和改进的全局 MHSA 机制,我们设计了 M2ANET 模型,用于在血细胞图像中高效分类疟原虫,通过对基准测试的广泛实验,我们证明了 M2ANET 在准确性和效率方面优于一些先进的轻量级和移动网络,同时讨论了 M2 - 可解释的少样本知识追踪
基于大型语言模型的认知引导框架可在少量学生记录的情况下追踪学生的知识,并提供自然语言解释。实验结果显示,大型语言模型可与竞争性深度知识追踪方法相当或更优。
- 基于令牌化的马巴模型中的中央化马巴交叉扫描用于高光谱图像分类
利用创新的 Mamba-in-Mamba (MiM) 架构和利用 State Space Model (SSM) 的首次尝试,本研究提出了用于高光谱图像分类的 MiM 模型,通过改进的特征生成和集中方法以及改进的解码效率,优于现有基线和最先 - 脑机接口深度表示学习技术评述及建议
综述了 81 篇应用深度表示学习技术进行 BCI 解码的文章,发现自编码器是最常用的深度表示学习技术,同时呼吁为 EEG 信号解码专门设计基础模型,并建立专门的基准和数据集来促进其发展和持续改进。
- 一个灵活的框架,通过在大型视觉模型上植入人机协作来分析星系图像数据
通过利用大视觉模型和少样本学习等方法,本文提出了一个通用分析星系图像的框架,解决了天文数据处理中的重复工作和数据分布不平衡的问题,并通过人类知识的加入提高了处理星系图像的可靠性和解释性。该框架在星系图像的多个任务上展现了显著的少样本学习能力 - 图像压缩伪影减少的敏感度解耦学习
通过深度学习技术,本研究改进了图像压缩伪影降低方法,并提出了一种双重感知引导网络(DAGN),通过解耦图像的内在属性为伪影降低提供双重补充特征,并实现了较高的性能和效率。
- 从鸟瞰到街景:一项调查
通过筛选 20 篇研究论文,本研究全面回顾了从对应的卫星图像合成街景图像的最新技术,主要发现是:(i)需要采用新颖的深度学习技术来合成更加逼真准确的街景图像;(ii)需要收集更多的数据集供公众使用;(iii)需要研究更加具体的评估指标来恰当