- 线性回归中的缩放定律:计算、参数和数据
大规模深度学习模型的实证研究表明,随着模型大小和数据规模的增加,训练模型的测试误差呈多项式改进;然而,神经缩放定律的一般形式预测增加模型大小会单调改善性能,这与传统的认知不同,即测试误差包含逼近、偏差和方差误差,并且方差错误随模型大小增加而 - 深度学习模型的双重思维与感知分析使用人类对抗性示例
该研究提出了双重思维框架,通过引入对抗性数据集证明了人类视觉中双重思维的存在,同时研究了深度学习模型的定性行为,并通过使用实例分割模型来解决使用分类模型作为人类视觉计算模型的主要批评。该研究强调了形状在人类视觉中识别实例的重要性,并显示深度 - 基于 Transformer 模型的广义水文预测:120 小时流量预测
该研究探讨了 Transformer 模型在美国爱荷华州 125 个不同位置的 120 小时溪流预测中的有效性。利用前 72 小时的数据,包括降雨量、蒸发蒸腾量和流量值,我们开发了一个通用模型来预测未来的溪流流量。我们的方法与通常依赖于特定 - 一个针对多模态气候变化感知作物产量预测的开放和大规模数据集
通过引入 CropNet 数据集,该研究提供了一个多模态数据集,用于在县级别上准确预测作物产量,考虑了短期和长期气候变化的影响,并验证了其在气候变化感知作物产量预测中的一般适用性和有效性。
- INTERSPEECH 2009 情感挑戰重探:在語音情感識別領域 15 年的進展基準
重新回顾评估深度学习模型在语音情感识别研究中的最新进展,表明尽管取得了一些进步,FAU-AIBO 仍然是一个具有挑战性的基准,而新的方法并不一致地优于旧的方法,显示解决语音情感识别问题的进展不一定是单调的。
- 利用眼部结构变化预测青光眼进展的深度学习
利用深度学习模型,该研究探索了青光眼的结构功能关系,从结构性眼部退化中预测功能受损,并且开发出半监督时间序列算法以准确预测青光眼的进展。
- 从基础到额外特征:超图变换器在电子病历上的预训练 - 微调平衡的临床预测
我们提出了 HTP-Star,它利用超图结构和预训练再微调的框架来模拟电子健康记录数据,实现了额外特征的无缝集成,并设计了两种技术来增强模型的鲁棒性。通过在两个真实电子健康记录数据集上进行实验,我们证明了 HTP-Star 在基础特征和额外 - 将人类知识与视觉概念对齐,实现可解释的医学图像分类
通过融合领域知识与大型语言模型,Explicd 提出了一种可解释的、以诊断标准为基础的语言辅助诊断框架,不仅模拟了人类专家的决策过程,还提高了医学图像分类性能。
- 数据稀缺条件下的图挖掘
我们的研究提出了一个不确定性估计框架,可应用于任何泛化图神经网络(GNN)的基础网络上,以提高节点分类性能。该不确定性估计器模型是一个神经网络,将不确定性建模为概率分布而非离散的概率标量值。通过在 $n$ 路 $k$ 样本方式下进行训练,我 - 关于形状偏差、准确性和鲁棒性之间关系的澄清
通过评估 39 种数据增强类型对广泛使用的 OOD 数据集的影响,证明了每种数据增强对模型对 OOD 数据的鲁棒性的影响,并进一步证明了所述假设不成立;形状偏差的增加不一定导致更高的 OOD 鲁棒性。通过分析结果,还发现 ImageNet- - 从组织平面到器官世界:基于深度共同注意网络的多模态生物医学图像配准基准数据集
利用深度学习模型,我们创建了 ATOM 基准数据集,旨在将组织学到器官的配准问题转化为机器学习问题,并提供引领生物医学界的卓越结果。我们的 RegisMCAN 模型的性能展示了深度学习准确预测从整体三维体积中提取的器官图像的子区域所在位置的 - 全景 X 光片中的实例分割和牙齿分类
通过整合深度学习模型 U-Net 和 YOLOv8,本研究提出了全景 X 射线下牙齿分类和分割的高效可靠的新架构 BB-UNet,并提出了医学数据集用于评估,为牙科诊断领域中的目标检测模型的更广泛应用铺平了道路。
- 多维向量神经元:更好更快的 O (n) 等变 Clifford 图神经网络
本研究通过测试几种基于 Clifford 多矢量的新颖消息传递图神经网络(GNNs),旨在解决当前大多数对 $O (n)$ 或 $SO (n)$ 等等变换具有等变性的深度学习模型在处理标量信息时效果较好,但计算复杂度较高的问题。我们的方法利 - 多变量物理信息卷积自编码器用于高分布式能源资源渗透率电力分配系统中的异常检测
本文提出了一种多变量物理信息卷积自编码器(PIConvAE)模型,用于检测具有不平衡配置和高分布式能源资源渗透的电力配电系统中的网络异常。该模型通过定制的损失函数将物理规律嵌入到自编码器的训练过程中,通过对 IEEE 123-bus 系统和 - 非线性转换对抗无法学习的数据集
我们研究和设计了一个有效的非线性转换框架,并进行了广泛实验以证明深度神经网络可以有效地学习以往被认为是无法学习的数据 / 示例,从而提高了打破无法学习数据的能力,显示出比线性可分技术更好的性能,进一步指出现有的数据保护方法在防止未经授权的机 - Pl@ntNet 人工智能算法的合作学习:工作原理与改进方法
通过基于用户能力从协作数据中递归估计正确识别记录的植物种类,我们提出了一种标签汇聚策略来协同训练植物识别 AI 模型,并通过评估用户技能的多样性增强标记性能,这强调了人类注释和数据过滤的协同作用以提高 AI 性能。
- 合成数据异常值:身份泄露导航
通过对合成数据的异常值进行分析,我们的研究发现链接攻击方式可能会导致异常值被重新识别,并且差分隐私等额外安全措施可以预防重新识别,但会损失数据可用性。
- 持续无监督的外部分布检测
不断进行未标注 OOD 检测的新设置,使用融合 Mahalanobis 距离和最近邻方法的 U-OOD 评分函数,并设计了一种置信度缩放的少样本 OOD 检测器,大幅改善相关领域的强基准模型。
- 基于 Transformer 的卫星载荷处理遥感图像的低秩适应
该研究论文提出了一种基于参数高效微调技术的低秩适应模块(LoRA)方法,通过训练低秩矩阵参数并将其与原模型的权重矩阵相乘和相加,从而微调模型参数以适应新的数据分布,实现了几乎全微调效果的模型性能提升,并加速模型训练迭代和提高定向目标检测模型 - 通过治疗效果分析提升预测性成像生物标志物的发现
本研究旨在通过深度学习模型从治疗前图像中发现和验证预测性影像生物标志物,以预测个体治疗效果,推动个性化医学决策。