- 探索 Kolmogorov-Arnold 网络在分类中的限制:对软件培训和硬件实现的见解
该研究验证了 Kolmogorov-Arnold Networks 在处理分类问题上的效果,并通过硬件实现展示了其与多层感知器在高复杂度数据集上准确性和硬件资源利用方面的差异,结果表明多层感知器依然在软件和硬件实现中保持准确性和效率。
- 使用神经平移的适当正交分解自动进行运输分离
本文介绍了一种基于神经网络的方法,用于利用移位的适当正交分解(sPOD)分解输运主导场。该方法通过训练两个子网络来同时估计输运和共移场,从而解决了传统 sPOD 方法需要事先了解输运算子以确定共移场的问题。通过应用于合成数据和野生火灾模型, - FIIH:全可逆图像隐藏的安全与稳健
该论文提出了一种基于可逆神经网络的全可逆图像隐藏架构,旨在实现对秘密图像的可逆隐藏,从而在数据和网络上都可逆。该方法能够抵御基于深度学习的图像隐写分析,并提出一种在传输过程中干扰后增强隐写图像鲁棒性的新方法。实验证明,论文中提出的全可逆图像 - ICML神经对决巴甸
应用神经网络估计奖励函数、提出一种基于上界置信度和汤普森采样的算法,解决了上下文对决匹配问题中线性奖励函数假设带来的挑战,并在合理次数内选择最佳策略。同时扩展理论结果到带有二元反馈的上下文匹配问题。
- 使用可微分替代方法学习黑盒模型的特定实例参数
在这项工作中,我们能够首次为黑盒计算学习输入特定的参数,我们选择了受欢迎的图像去噪方法 BM3D 作为黑盒计算的测试应用,并使用可微分的替代模型(神经网络)来近似黑盒行为,进而使用另一个神经网络以端到端的方式学习黑盒的输入实例特定参数,在图 - 使用卷积神经网络对每个乐器音轨进行自动均衡
我们提出了一种用于自动均衡个别音乐乐器音轨的新方法,通过识别源录音中的乐器来选择对应的理想频谱作为目标,计算录音和目标之间的频谱差异,并利用可微分的参数化均衡器匹配神经网络预测参数设置。与之前的方法不同,我们的系统允许在训练匹配模型时自动产 - 基于卷积神经网络的路面疲劳裂纹检测和严重程度分类
通过建立一个包含 4484 张高分辨率路面表面图像的数据库,本文提出了一个新颖的深度卷积神经网络,其目标是基于路面表面图像对疲劳裂缝的存在和严重程度进行分类,经过 30 个训练阶段,该模型的分类准确率分别达到了 96.23% 和 96.74 - 基于观测数据直接训练和初始化的气象预报
通过对观测数据进行训练,我们提出了一种全新的方法,使用神经网络来预测未来的天气,避免了对基于物理模型的数据同化的依赖,并成功学习了实际观测中捕捉到的物理过程的时间演化。
- 对抗电路评估
我们通过对输入的敌对性评估了文献中的三个电路(IOI、大于、文档字符串),测量了它们与全模型输出之间的 KL 散度,并分析了表现最差的输入。结果表明,即使在原始任务的完全良性输入上,IOI 和文档字符串任务的电路也无法像全模型一样行为一致, - 重新审视自动语音识别性能中的种族差异:源自区分干扰的作用
现在广泛使用基于大量音频数据训练的自动语音识别(ASR)模型将语音转换为书面文本,在视频字幕到医疗保健等各个领域中使用自动助手。本研究旨在通过研究当前最先进的基于神经网络的 ASR 系统(Whisper,OpenAI)在 CORAAL 数据 - 自动漂移的神经网络轮胎力建模
使用神经网络车辆模型改进自动漂移时的车辆控制,在模拟和对比中证明了该模型在前轮制动情况下具有显著改善的路径跟踪性能。
- 基于 Transformer 的 2-SAT 求解器的机理解析:一种公理化方法
通过机械翻译解释和抽象解释的概念,采用近似语义描述,我们给出了机械翻译的公理集,并使用此公理集来分析基于 Transformer 模型的解决 2-SAT 问题的模型,成功地逆向工程了所学习的算法。
- FSP-Laplace:贝叶斯深度学习中拉普拉斯近似的函数空间先验
我们提出一种基于拉普拉斯近似和高斯过程先验的方法,通过直接在函数空间中施加先验来解决深度网络中整体性误差估计的问题,并通过矩阵自由线性代数的高度可扩展方法获得改进的结果。
- 预条件共轭梯度递归发现具有尖锐概括性的过度参数化神经网络用于非参数回归
我们考虑使用梯度下降或其变种训练过度参数化的二层神经网络进行非参数回归,并证明了在神经网络使用经典梯度下降方法配合早停止训练时,当目标函数具有在深度学习文献中广泛研究的谱偏差时,训练后的网络提供了更尖锐的广义界限,具有最小化的最优速率。
- 大气状态的神经压缩
通过使用神经网络文献中的方法,将球面数据适应传统神经网络结构,采用面积保持 HEALPix 投影,我们提出了一种压缩大气状态的方法,展示了超过 1000x 的压缩比,并以每秒全球大气状态的速率进行压缩和解压缩。
- 学习实现亚像素精确的关键点检测
通过学习检测到的特征的偏移向量,我们提出了一种新的网络,以在关键点定位准确性方面增强任何检测器,从而消除了设计专门的子像素准确检测器的需要,并直接最小化了相对姿态误差等测试时间评估指标。
- SegSTRONG-C: 对非对抗性生成失真具有稳健性的手术工具分割 —— EndoVis'24 挑战
通过引入仿真手术图像的逼真非对抗性破坏,本研究旨在提高在手术环境中机器学习模型的准确分割性能,以便支持机器辅助手术。
- 知识蒸馏的不变一致性
知识蒸馏技术中,我们引入了不变一致性蒸馏法(ICD),该方法结合了对比学习和明确的不变性惩罚,以确保学生模型的表示与教师一致,并在 CIFAR-100 数据集上证明其优于传统知识蒸馏技术和 13 种最先进方法,在一些情况下,学生模型的准确性 - 图像生成的光学扩散模型
通过光学透明层的传播,实现了在图像样本中运用去噪扩散模型的编程,从而实现了高速图像生成并降低能量消耗。
- 通过深度学习近似 G (t)/GI/1 队列
该研究应用监督机器学习方法解决排队理论中的一个基本问题,即估计 G (t)/GI/1 系统中数量的瞬时分布。研究采用基于神经网络的机制,通过使用瞬时到达时间和稳态服务时间分布的前几个矩的循环神经网络(MBRNN)方法,提供了快速准确的预测模