- 拓扑优化中生成更好局部最优解的神经网络
通过使用神经网络材料离散化方法,结合 Adam 优化器,在拓扑优化问题中得到更好的局部最优解,特别是在声学拓扑优化中。
- 卷积神经网络的网络反演
该论文介绍了一种简单而有效的网络反演方法,利用一个精心调制的生成器来学习经过训练的神经网络输入空间中的数据分布,从而使得可以重构出最有可能导致所需输出的输入。论文还讨论了网络反演的即时应用,包括解释性、可解释性和对抗样本的生成。
- 神经网络下的终身图摘要:2012、2022 年和时间弯曲
通过神经网络对网络图进行终生图形摘要,我们研究了网络图的摘要问题。我们使用 GNNs Graph-MLP 和 GraphSAINT 以及 MLP 基准来总结时间图。我们调查了重用前一个快照中的参数对神经网络的反向和正向转移以及遗忘率的影响。 - 基于梯度的神经网络推断抽象任务表示用于泛化
人类和动物展示了适应性行为,可以根据内部目标对相同的输入做出不同反应。我们研究了任务抽象训练的神经网络是否能获得灵活决策、广泛泛化能力以及更高的学习效率,并证明了基于梯度的推断在当前任务需求的推测中发挥了关键作用。
- 自校准的方差稳定变换用于现实世界图像去噪
通过可适用的方差稳定变换 (VST),我们证明了专门用于去除高斯噪声的去噪网络能有效地用于真实世界图像的去噪,而无需额外的训练。
- 基于 BERT 和 Levenshtein 距离的全面拼写纠错方法
本研究利用神经网络和 BERT 掩码语言模型相结合的方法,识别和纠正不同类型的拼写错误,结果表明该系统在识别和纠正拼写错误方面具有显著能力,常常超过专为波斯语设计的现有系统。
- 结构性断点下天然气价格的区间预测:统计模型与神经网络
研究了使用现代机器学习方法(如神经网络)与统计模型(如 ARMA 模型和时序模型)进行对比,发现在气体价格冲击期间,简单模型表现更好,并且长期短期神经网络被竞争对手超越。
- ECCV从多视角图像中学习无符号距离函数与体渲染先验
使用神经网络生成无符号距离函数的差分可微渲染器,通过学习体素渲染先验知识将未知场景的无符号距离函数映射到 RGB 图像渲染中,从而在性能上超过现有方法。
- 重新思考非分布式数据驱动下的分布式检测
通过统计观察,识别出两个常见的问题:误将尾部类 ID 样本误识别为 OOD,同时错误地将 OOD 样本预测为 ID 的头部类,为了解释这一现象,提出了名为 ImOOD 的统计框架来解决不平衡数据分布下的 OOD 检测问题,进而揭示了平衡和不 - 综合梯度的代数对抗性攻击
在这项研究中,我们提出了代数对抗性示例,并研究了能够为综合梯度生成对抗性示例的条件,代数对抗性示例为对抗性示例提供了一个数学可行的方法。
- 像素嵌入:带有可微分查找表的完全量化卷积神经网络
通过使用像素嵌入替代浮点输入像素,我们提出一种全量化深度神经网络的方法,通过查找表将每个浮点输入像素替换为一个由量化值组成的向量,实验证明像素嵌入可以显著减小由于浮点数量化而导致的错误率差距,并且相比于浮点精度第一层,推理时间可以加速 1. - 无脑者:软体机器人中基于形态计算的自适应行为
研究在没有独立和明确的大脑控制的情况下,通过机器人自身物理体内的计算来创造智能行为,并展示了基于体素的虚拟软机器人使用简单的反应性材料来实现自适应和复杂行为。
- ICML一个在循环神经网络中进行规划行为的 Sokoban 游戏
通过对神经网络的训练和研究发现,为了预测其在新情境中的推广能力,理解神经网络的推理过程是至关重要的。
- 倒置激活
该研究论文通过提出一种处理点非线性层激活张量的方法,即保存输出张量而不是输入张量,来解决神经网络训练中的内存占用问题,特别适用于 GPT、BERT、Mistral 和 Llama 等基于 Transformer 架构的应用,并通过实验证明本 - 应用多输出卷积神经网络预测数学表达式中的底数和指数
使用卷积神经网络 (CNN) 对数学表达式的图像进行预测,该模型通过训练具有多输出的简化 CNN 模型,在包含随机噪声、字体大小变化和模糊强度的合成图像数据集上取得了高准确率,证明了该方法在处理噪声和多变输入图像方面的有效性。
- 无绑定运动转换的时间残留雅可比
我们介绍了时间残差雅可比矩阵作为一种新颖的表示方法,以实现数据驱动的动作转移。我们的方法不依赖于任何装配或中间形状关键帧,产生几何和时间上一致的运动,并可用于转移长时间序列。我们的方法的核心是两个耦合的神经网络,分别预测局部几何和时间变化, - 神经拓扑优化:好的、坏的和丑陋的
神经拓扑优化(NTD)将神经网络(NN)用于决策空间再参数化和优化景观重塑,该方法的分析工具揭示出 NN 对优化过程的重要影响,NN 架构的选择显著影响目标景观和优化器的最佳路径,NN 即使在原本凸优化问题中也引入非凸性,可能延迟凸问题的收 - RISC-V 内核上的混合精度神经网络:用于多泵软 SIMD 操作的 ISA 扩展
通过引入 ISA 扩展和硬件设计来优化混合精度硬件的 RISC-V CPU 体系结构,我们的研究工作首次提出了一种硬件 - 软件共同设计框架,以实现混合精度量化和推理的协同,并验证通过广泛的实验评估表明,我们的框架可以在准确率损失不超过 1 - InterpBench: 半合成变压器用于评估机械解释技术
InterpBench 是一个包含真实电路的半合成变压器神经网络集合,用于评估机制解释能力的方法,通过 Strict IIT 对神经网络进行训练,使用 Tracr 工具生成罕见变压器模型,并使用这个基准评估电路发现技术。
- 具有随机竞争的变压器用于表格数据建模
基于 Transformer 架构和两种形式的随机竞争,我们提出了一种为表格数据特别设计的新型随机深度学习模型,并在广泛使用的公开数据集上验证了其高性能及深度学习在表格数据应用方面的显著进展。