deep neural networks | BriefGPT

关键词deep neural networks

搜索结果 - 4075

扩散模型下的无监督自学习预训练用于 X 光图像中的少样本地标检测
本研究介绍了一种基于弥散模型的自监督预训练协议，用于 X 射线图像中的地标检测，结果表明该自监督框架在少量可用的已注释训练图像（最多 50 张）上能够提供准确的地标检测，优于 ImageNet 有监督预训练和最先进的自监督预训练方法，这是首
PDF2 days ago
使用视觉与语言模型建模人类概念处理中的多模态集成
当前的视觉和语言深度神经网络模型（VLMs）整合多模态信息，其表示与大脑活动高度相关，比起纯语言和纯视觉深度神经网络模型（DNNs）具有更好的大脑一致性，同时与行为一致性无明显关系。
PDF2 days ago
事件和发生的标签噪声下的稳健深度 Hawkes 过程
深度神经网络与 Hawkes 过程的整合在金融、健康信息学和信息技术方面显著提高了预测能力。然而，这些模型在现实环境中常常面临挑战，特别是由于标签噪声的存在。我们的研究表明，深度 Hawkes 过程模型在处理标签噪声时表现出较低的鲁棒性，特
PDF3 days ago
透过异常检测的视角观察模型去偏差化
通过异常检测方法，我们提出了一个新的偏差识别方法，结合偏差数据上采样和增强，实现了目前在合成和真实基准数据集上最先进的性能。我们证明了数据偏差问题并不一定需要复杂的去偏方法，只要定义一个准确的偏差识别过程即可。
PDF3 days ago
McGAN: 将制造规则嵌入条件生成对抗网络生成可制造的设计
使用深度神经网络结合设计制造 (DFM) 规则，将不可制造的设计转化成可制造的设计，实现了高效和鲁棒性的自动生成。
PDF3 days ago
分布感知的长尾数据噪声标签下的鲁棒学习
提出了一种名为 DaSC 的稳健训练框架，它引入了一种分布感知的类别中心估计方法（DaCC）来生成增强的类别中心，并通过自信对比学习策略获得平衡和稳健的表示。与以往方法相比，该方法在 CIFAR 和现实世界的带有噪声标签的数据集上表现出更好
PDF4 days ago
超视无学习范式中动物行为分割算法研究
行为视频的动作分割是将每个帧标记为属于一个或多个离散类别的过程，它是研究动物行为的许多研究中至关重要的组成部分。我们系统地研究了几种算法在四个跨物种的数据集上的输出与人工注释的行为之间的一致性，其中包括基于树模型、深度神经网络和图模型的算法
PDF4 days ago
深度神经网络如何在全局最优值的情况下失败？
通过最小化成本函数来构建适用于准确预测的模型，本研究旨在使用一种简单技巧扩展浅层神经网络的表达能力，构建极度过拟合的深度神经网络，尽管具有全局最优解，但在分类和函数逼近问题上仍无法表现良好。不同类型的激活函数被考虑，包括 ReLU，Para
PDF4 days ago
面向向量场数据视觉分析的不确定性感知的深度神经表示
我们开发了一种具有不确定性意识的隐式神经表达方法，以有效地对稳定向量场进行建模，并全面评估了两种深度不确定性估计技术的功效：深度集成和蒙特卡洛丢失，旨在实现对稳定向量场数据特征的基于不确定性的可视分析。通过使用多个向量数据集进行详细的探索，
PDF4 days ago
自适应无偏风险估计的无监督磁共振图像去噪方法
通过引入 Stein 的无偏风险估计器（SURE）、其扩展（eSURE）以及我们的新方法，即扩展泊松无偏风险估计器（ePURE），在医学图像框架中对这些方法进行了全面评估。我们的主要贡献在于有效地适应和实施 SURE、eSURE 以及特别是
PDF5 days ago
HyperbolicLR: 基于时期不敏感的学习率调度器
本研究提出了两种新颖的学习率调度器：超博弈学习率调度器（HyperbolicLR）和指数超博弈学习率调度器（ExpHyperbolicLR）。实验证明，这些调度器相较于传统调度器在调整迭代次数时能够维持更加一致的学习曲线，从而使深度神经网络
PDF6 days ago
深度状态空间循环神经网络进行时间序列预测
本文研究了用于建模加密货币市场动态的各种神经网络架构，并提出了将计量状态空间模型的原理与循环神经网络的动态能力相结合的新型神经网络框架。根据结果显示，受到 Kolmogorov-Arnold Networks (KANs) 和 LSTM 的
PDF6 days ago
行为克隆是否足够？理解模仿学习中的可视空间
在这篇研究论文中，通过对行为克隆与对数损失的新分析，我们证明了在控制了累积回报的范围和适当的政策类别的监督学习复杂性的情况下，可以实现无关于问题水平的样本复杂度。特化到确定性、稳定的策略，我们发现离线学习与在线学习之间的差距并不是根本性的，
PDF7 days ago
非线性薛定谔网络
介绍了一种名为 “非线性薛定谔网络” 的新型物理基人工智能模型，它将非线性薛定谔方程作为可训练模型，可用于学习复杂模式和非线性映射，具有更可解释性和参数效率，用于时间序列分类任务时能够显著减少所需参数数量。
PDF8 days ago
ECCV发现 - 命名：通过自动概念发现实现任务无关的概念瓶颈
使用稀疏自编码器先发掘模型学到的概念，再为其命名并训练线性探针，提出一种新的 CBM 方法（称为 Discover-then-Name-CBM），该方法能生成语义有意义且易于解释的概念，从而产生性能优异和可解释的 CBMs。
PDF8 days ago
联合还是分离：混合训练策略用于早停模型
通过研究早期退出方法的训练策略，本研究对早期退出的性能和效率进行了理论和实证分析，并评估其在不同架构和数据集上的适用性。
PDF8 days ago
StoX-Net：用于高效内存计算的随机处理部分和的 DNN 加速器
基于横向栅构建的内存计算是一种应用于深度神经网络硬件加速的有前景的平台，然而能耗和延迟主要由外围模拟数字转换器的巨大开销所决定，为了解决该问题，本文提出了实现数组级部分和的随机处理，借助旋转轨道磁隧道结的概率性切换，该处理方式消除了昂贵的模
PDF10 days ago
通过定向的角点增强多边形建筑物分割
本文介绍了一种名为 OriCornerNet 的新型深度卷积神经网络，可直接从输入图像中提取建筑多边形，并通过使用图卷积网络进行迭代细化来生成简化的多边形，包括几何信息的使用有助于产生更规则和准确的结果。在 SpaceNet Vegas 和
PDF10 days ago
借助内在方法解释深度神经网络
通过研究深度神经网络的可解释性，本文提出了增强深度神经网络可解释性的新技术，包括集成外部内存、使用原型和基于约束的层以及探索神经元激活值相关的现象。此外，本文还分析了可解释性技术在视觉分析领域的应用，探索了这些系统传达解释给用户的成熟度和潜
PDF10 days ago
ECCV任何目标均可成为攻击：通过广义潜在感染生成对抗性样本
针对深度神经网络的脆弱性评估，我们提出了一种通用的对抗攻击器（GAKer），能够生成对任何目标类别构建对抗性样本，该方法在生成已知和未知类别的对抗性样本方面取得了较高的攻击成功率。
PDF10 days ago