- 在飓风疏散时为高效管理实际大型交通网络部署可扩展的流量预测模型
基于多层感知器与长短期记忆模型的交通预测系统应用于路易斯安那州实施的真实交通预测系统中,在 7 天飓风影响期间 6 小时的长期拥堵状态预测准确率达到 82%,并且短期速度预测模型在 1 至 6 小时的疏散时段中表现出 7%至 13%的均方绝 - MM基于双空间原型网络的重新定义的 DDoS 攻击检测方法
介绍了一种基于深度学习的新技术,用于检测分布式拒绝服务攻击,在各种攻击模式中通过几何和角度相似性度量改善检测准确性。使用离线训练、模拟在线训练和原型网络场景进行了全面评估,表明该模型在不同数据充裕和稀缺条件下具有稳健性。
- LLM 与 GNN 互补:用于多模态图学习的 LLM 蒸馏
利用 GALLON 框架,将 LLMs 与 GNNs 能力结合起来,通过提取多模态知识到一个统一的多层感知器模型(MLP),集成了分子的丰富文本和视觉数据与 GNNs 的结构分析能力,显著提高了分子性质预测的准确性和效率。
- ICML非参数式隐式神经表征的教学
通过使用超参数化的多层感知器(MLP)和非参数化教学角度,我们研究了隐式神经表示(INR)的学习。我们提出了一种名为隐式神经教学(INT)的范式,将 INR 学习视为一个非参数化的教学问题,通过选择信号片段进行迭代训练以实现快速收敛,在各种 - 重温基于 LiDAR 的 3D 物体检测中的超出分布检测
利用合成的离群对象数据生成特征图以对未知物体进行检测并使用多层感知器分类,从而有效处理自动驾驶中的风险和可靠性问题。
- 解读 Transformers 中的上下文查找:调查 Attention-MLP 交互
通过研究注意力头与特定 “下一个标记” 神经元在预测特定标记的多层感知机中的相互作用,我们可以揭示激活特定下一个标记神经元的注意机制。具体而言,我们关注在较早层次中不同提示下始终激活相同下一个标记神经元的注意力头。我们的方法结合了神经解释和 - BMLP:面向异构序列推荐的行为感知多层感知机
基于多层感知器 (MLP) 的异构顺序推荐方法 (BMLP) 通过建模多种行为类型和转换关系的异构兴趣知觉模块 (HIP) 以及自适应融合辅助行为子序列以捕捉用户购买意图的购买意图知觉模块 (PIP),相比主要的序列模型,在准确性方面具有竞 - SecureReg: 一个综合框架,用于主动暴露恶意域名注册
通过比较新注册的域名与已注册的域名的相似性分数,本研究引入了一种先进的方法来在注册过程开始时识别可疑域名。结合自然语言处理和多层感知器模型,该系统分析语义和数值属性,提供了早期威胁检测的强大解决方案,从而显著减少了漏洞窗口,加强了对潜在威胁 - 粒子形状系统中的复杂局部环境分类通过形状对称编码的数据增强
使用机器学习方法,我们提出一种简单而强大的多层感知器 (MLP) 分类器,通过训练粒子距离和方向等输入特征,能够检测和分析晶核形成和胶体颗粒自组装的局部环境,该方法具有物理无关性和数据扩充技术,对于研究粒子形状系统的自组装过程提供了有价值的 - 多层感知器优化跨领域少样本分类
使用多层感知器(MLP)解决跨领域少样本分类(CDFSC)的挑战,发现 MLP 可以显著提高判别能力和减轻分布偏移,与其他先进的 CDFSC 算法相比,显示出更好的性能。
- 关于雅可比正则化训练神经网络的无限宽度分析
该研究采用无穷宽度分析,证明了深度神经网络及其雅可比矩阵初始条件下,当隐藏层宽度趋近无穷时,它们共同收敛于高斯过程,并通过一种线性一阶常微分方程描述了在所谓鲁棒训练下的多层感知机演化,该方程由一种神经切向核的变体决定。实验证明了理论断言与宽 - QuasiNet:具备可训练的乘积层的神经网络
我们提出了一种灵感来自现有神经网络模型的新的神经网络模型,该模型具有所谓的乘积神经元和源自传统误差反向传播的学习规则,优雅地解决了互斥情况的问题。与现有的乘积神经元不同,我们的神经元层的乘积层也可以学习。我们对模型进行了测试,并将其成功率与 - 无需贝尔曼完备性:基于模型的回归条件监督学习的轨迹拼接方法
在本文中,我们展示了基于回报条件的监督学习(RCSL)的离策略学习技术如何在具有放松了的 Bellman 完备性条件下收敛,使用两层多层感知机作为函数逼近器时实现了与动态规划方法相媲美的性能,并提出了 MBRCSL 框架,通过利用学习的动力 - 学习镜头模糊场
通过引入高维度的神经模型 ——{lens blur field} 和一种实用的获取方法,我们成功解决了现代相机中复杂光学元素导致的光学模糊的建模难题,并展示了通过获取 5D 模糊领域可以揭示出同款智能手机设备的光学行为差异的现象。
- 点云网络:线性层参数数量的数量级改善
引入了 Point Cloud Network (PCN) 架构,通过对线性层的直接比较,提供经验证据证明 PCN 优于多层感知机 (MLP)。在 CIFAR-10 和 CIFAR-100 数据集的训练中,AlexNet-PCN16 在其线 - 神经特征学习中的帕累托前沿:数据、计算、宽度和运气
该研究调查了深度学习在计算统计差距存在的情况下的算法设计选择。通过考虑离线稀疏奇偶学习,一种多层感知器的梯度训练的统计查询下界,我们展示了稀疏初始化和增加网络宽度在样本效率方面的显著改进,以及合成稀疏奇偶任务对于需要轴对齐特征学习的真实问题 - 基于困难样本挖掘的对比学习方法用于风力发电机叶片系统故障诊断
本文提出了一种基于对比特征学习的硬样本挖掘方法,通过学习区分表示来诊断风力发电机叶片调 pitch 系统的故障。实验表明,该方法在故障诊断准确性上具有显著优势。
- CVPR学习神经双工辐射场进行实时视图合成
本篇论文提出了一种新的方法,通过将 NeRFs 融合为可与高度并行的图形渲染管线完全兼容的高效网格神经表示,使用屏幕空间卷积,来提高外观的质量和整个框架的表现。
- 跨模态信息检索是否可以无需训练?
本文提出了一种基于深度学习预训练模型的编码表示方法,使用简单的最小二乘和奇异值分解(SVD)解决 Procrustes 问题来构建不同模态之间的语义对齐,并通过对预训练模型进行反证学习和多层感知机改进,实现了在图像和文本交叉检索任务中可比拟 - 初始状态下的 Transformer 有效理论
本文针对宽且深的 Transformer 模型中的正反向信号传播进行了有效理论分析,提出了相应的模型初始化和训练超参数的宽度缩放建议,最终在实际场景中训练了视觉和语言的 Transformer 模型