认知神经网络
本文提出在大规模语言模型上加入 epinet 网络架构以取得 epistemic neural network (ENN) 优化的结果,使用该方法在 GLUE 任务中,不仅可以达到和 BERT 相同的性能表现,还能使用少两倍的数据。同时,该方法在神经网络生成模型中也表现良好,优于启发式主动学习方法。
Nov, 2022
在航空航天工程系统的高效设计探索中,使用嵌入仿真器的神经网络,并充分利用多样化数据源对多个模型实现进行训练,以评估由于训练样本不足而引起的认知建模不确定性,并在目标导向的自适应学习中提供关键信息。然而,由于集成模型的训练成本往往变得禁止并带来计算上的挑战,所以本研究提出使用快速神经网络范例的新型嵌入仿真器的神经网络,通过应用线性回归技术仅调整最后一层的连接权重,以在几乎即时训练的情况下保持预测准确性。该方法在多个分析实例和通用高超声速飞行器的航空参数研究中得到了验证。
Sep, 2023
我们介绍了 EINNs,这是一个基于机械模型提供的理论基础和人工智能模型提供的数据驱动的表达能力,以及摄入异构信息的能力,用于流行病预测的框架。通过物理 - 信息神经网络的工作来学习潜在的流行病动态并将相关知识转移给另一个神经网络,这个网络摄入多个数据源,并具有更适当的归纳偏差。我们的全面实验表明,与其他非平凡的选择相比,在 COVID-19 和流感预测的所有美国州和 HHS 地区都展示了我们方法的明显优势。
Feb, 2022
本文提出了一种名为 Epistemic 神经网络 (ENN) 的方法,通过准确的联合预测分布来近似输出预测分布来实现 TS,实验结果表明,ENN 可以相对准确地近似 TS,并且 extit {epinet} 可以用更低的计算成本与大型集合的性能相匹配。
Feb, 2023
本文介绍了一种新的训练技术 Anticipate, Ensemble and Prune (AEP),它基于权重集成的早期退出,旨在利用网络结构中的信息来最大化其性能。通过一系列全面的实验,我们展示了使用这种方法可以使平均准确性提高高达 15%,并且该方法在混合权重配置下,还可以通过内部修剪操作减少参数数量高达 41%,减少乘法和加法的数量 18%,并缩短推理所需的延迟时间 16%。
Jan, 2023
我们提出了一种自动增强流程,将现有模型转换为 EENN,并为异构或分布式硬件目标执行所有必需的设计决策。我们的方法在物联网和标准图像分类用例中都能有效降低推理成本,并大大减少 EENNs 的搜索成本,提高了神经网络在各种实际应用中的效率。
Mar, 2024
本文提出了一种新型的基于 WGAN 的 evidential neural network (WENN),通过在模型训练中进行多维不确定性建模,增强了 OOD 检测的性能,从而在绝大多数数据集上优于对手模型。
Dec, 2020
本论文介绍了一种基于 Deep Probabilistic Ensembles 的可扩展方法,该方法使用一个规则化的集合来近似 deep BNN。我们对大规模的视觉主动学习实验进行了一系列研究并在 CIFAR-10,CIFAR-100 和 ImageNet 数据集,以及 BDD100k 数据集上进行了语义分割的评估。我们的模型需要更少的训练数据才能实现竞争性能,并随着注释预算的增加而稳步提高。
Nov, 2018
该论文提出了一种深度学习可扩展的确定性和不确定性评估框架,并对两种最先进的可扩展方法进行了比较,即集成和 MC-dropout,结果表明集成方法提供更可靠和实用的不确定性估计。
Jun, 2019
本研究提出了一种替代贝叶斯 NN 的简单实现方法,其能够产生高质量的预测不确定性估计,并在分类和回归数据集上进行了实验以证明这一点。此外,研究还评估了在已知和未知数据分布下的预测不确定性,并证明该方法能够在超出分布的样本上表现出更高的不确定性,同时在 ImageNet 上证明了该方法的可扩展性。
Dec, 2016