deep neural network architectures | BriefGPT

关键词deep neural network architectures

搜索结果 - 10

状态空间模型作为基础模型的控制论概述
近年来，将线性状态空间模型（SSM）整合到深度神经网络架构的基础模型中的兴趣日益增长。该论文对控制理论家介绍了 SSM 基于架构，并总结了最新的研究进展，对最成功的 SSM 提案进行了系统回顾，从控制理论的角度突出了它们的主要特点。此外，我
PDF3 months ago
深度神经网络选择性分类基准测试
通过对包含图像和表格数据的多样化数据集进行实证评估，该研究对 18 种基线模型进行基准测试，比较了它们在选择错误率、实证覆盖率、被拒绝实例类别分布以及在分布外实例上的性能等多个方面的表现，结果显示没有一个明确的最佳方法，最好的方法取决于用户
PDF5 months ago
我们是否已经建造出像人一样思考的机器？
通过一系列的实验，我们评估了当前基于视觉的大型语言模型在直觉物理、因果推理和直观心理领域的表现。我们的研究结果表明，尽管这些模型在处理和解释视觉数据方面表现出显著的能力，但在这些领域仍然不如人类。这些模型对物理定律和因果关系有基本的理解，但
PDF7 months ago
逆问题的算法展开模型的统计学视角
在已知条件分布的情况下，通过算法展开设计深度神经网络架构，分析了梯度下降网络（GDN）的统计复杂性、最佳深度和过拟合问题。
PDF8 months ago
通过最优传输证明神经网络的线性模式连接性
理论上解释了以往实验观察到的两次随机训练之后找到的两个不同解经常通过简单连续路径（例如线性）通过权重的排列变换相连的现象，基于经验测度的 Wasserstein 距离的收敛速度，我们证明了用随机梯度下降训练的足够宽的两层神经网络的线性连接性
PDF8 months ago
迭代缩放与细化实现精准千万人群计数
本文介绍了一种名为 GigaZoom 的方法，它通过迭代地放大图像的密集区域并用更细的细节来改进更粗的密度图，从而实现了千兆像素人群计数的最先进精度，并将下一个最佳方法的精度提高了 42%。
PDFa year ago
通过网络规范化和超参数搜索优化解释
该论文提出了针对流行的深度神经网络结构，包括 VGG、ResNet、EfficientNet、DenseNets 和 Relation Networks 的模型规范化方法，并建立了一个 XAI 评价框架，用于量化和比较模型规范化对各种 XA
PDF2 years ago
ACL用于智能代理的自然语言理解快速可扩展功能
本文介绍了一种利用深度神经网络结构实现转移学习的方法，通过在已有的资源上进行最大限度的重用，扩展了常见商业代理的理解能力，显著提高了低资源场景下准确性，并显著缩短了模型开发时间。
PDF6 years ago
用于深度多任务网络的进化架构搜索
通过进化优化，结合自定义路由和共享模块，提高了 Omniglot 的多任务、多字符识别的表现，为深度神经网络和复杂系统设计提供了重要思路。
PDF6 years ago
ICLR学习激活函数以提高深度神经网络性能
使用自适应激活函数，设计了一种用于改进深层神经网络架构的分段线性激活函数，并在 CIFAR-10 等数据集上取得了最先进的表现。
PDF10 years ago