ICMLMar, 2021

带迭代注意力的通用感知器

TL;DR本文介绍了 Perceiver 模型,它利用了不对关系进行假设的 Transformer,同时还能在处理非常大的输入时进行规模扩展,通过迭代地将输入压缩到一个紧凑的潜在瓶颈中,并且在图像、点云、音频、视频和视频 + 音频等多个模态的分类任务中达到了与最佳模型相当的性能。