不确定性感知者

Feb, 2024

Uncertainty-Aware Perceiver

EuiYul Song

TL;DRPerceiver 模型在架构上具有少量假设，相对于 ResNet-50 和 ViT，在准确度方面具备一定竞争力，但忽略了预测不确定性和校准，并通过五个 Perceiver 改进，即 Uncertainty-Aware Perceivers，在不确定性估计方面取得了显著的性能提升。

Abstract

The perceiver makes few architectural assumptions about the relationship among its inputs with quadratic scalability on its memory and computation time. Indeed, the perceiver model outpaces or is competitive with

perceiver architecture uncertainty calibration performance enhancement

发现论文，激发创造

带迭代注意力的通用感知器

本文介绍了 Perceiver 模型，它利用了不对关系进行假设的 Transformer，同时还能在处理非常大的输入时进行规模扩展，通过迭代地将输入压缩到一个紧凑的潜在瓶颈中，并且在图像、点云、音频、视频和视频 + 音频等多个模态的分类任务中达到了与最佳模型相当的性能。

Mar, 2021

523 个 Imagenet 分类器的选择性预测和不确定性估计性能有什么可学之处

本文考察 523 个现有的深度图像分类器在选择性预测和不确定性估计性能方面的表现，发现蒸馏型训练方案普遍比其他训练方案具有更好的估计不确定性的能力，ViT 模型在不确定性估计方面的表现超过其他模型。

Feb, 2023

哪些模型天生就擅长不确定性估计？

探讨深度神经网络架构与训练机制与其相应的选择性预测和不确定性估计性能的关系，并在 484 个预训练的深度 Imagenet 分类器中进行了全面的选择性预测和不确定性估计性能研究，发现 ViT 架构在不确定性估计性能方面表现最优。

Jun, 2022

快速视觉感知的动态查询选择

本文探讨了如何在限制精度降低的同时，通过减少推理情况下的查询数量 Q，进一步提高 Perceivers 的效率，以解决网络复杂度和推理时间的问题。

May, 2022

Uni-Perceiver: 通用感知的预训练统一架构，用于零样本和小样本任务

使用 Uni-Perceiver 的通用感知架构进行多个任务和多个模态的统一建模和共享参数，在预训练和微调的阶段都表现出了可接受的结果和表现。

Dec, 2021

Perceiver AR 实现的通用、长上下文自回归建模

使用跨注意力机制构建了 Perceiver AR 机器学习模型，可自动学习高维的图像和音乐数据中的长期依赖关系，并在图像和书籍的测试中取得最优的结果，而无需人为设计稀疏模式或记忆机制。

Feb, 2022

预训练的视觉不确定性

准确的不确定性估计对可信赖的机器学习至关重要，本研究引入了视觉模型的首个预训练不确定性模块，类似于标准的预训练，这使得在大型预训练数据集上学习到的不确定性能够零样本迁移到专门的下游数据集，我们通过解决以前的不确定性模块中的梯度冲突并将训练加速了 180 倍，实现了在 ImageNet-21k 上的大规模预训练，我们发现预训练的不确定性能够泛化到未见过的数据集，通过审视学习到的不确定性，我们发现它们捕捉了与认知成分独立的基本不确定性，我们证明了这使得安全获取和不确定性感知的数据集可视化成为可能，为了鼓励将这项研究应用于更多的问题和领域，我们在以下链接中发布了所有预训练的检查点和代码。

Feb, 2024

Perceiver IO: 一种针对结构化输入输出的通用体系结构

本文提出 Perceiver IO 机器学习模型，它具有灵活的查询机制，能够处理来自任意领域的数据并对多种任务进行推理，其性能表现优于传统的 Transformer-based BERT 基准测试，并在 Sintel 光流估计方面取得了最先进的性能。

Jul, 2021

基於不確定性的注意力機制用於可靠的解釋和預測

通过引入输入相关的不确定度来学习输入不确定的实例的更大方差，我们使用变分推断学习了不确定性感知注意力机制，并在不同的高风险预测任务中验证了其有效性。进一步的评估表明，我们的模型生成符合临床医生解释的注意力，并通过学习方差提供更丰富的解释。

May, 2018

计算机辅助诊断中的不确定性量化：让你的模型对模糊病例说 “不知道

对于集成预测不确定性以提高深度学习患者安全性的图像分类器，我们评估了两种不同的方法。我们发现，这些方法使用光学相干断层扫描的数据集训练，能够得出更可靠的结果，有望提高患者安全性。

Aug, 2019