OmniNet: 基于 Transformer 的全向表示

Mar, 2021

OmniNet: Omnidirectional Representations from Transformers

Yi Tay, Mostafa Dehghani, Vamsi Aribandi, Jai Gupta, Philip Pham...

TL;DR本文提出了一种名为 Omninet 的模型，通过利用元学习来学习全方位的自注意力机制，并使用高效的自注意力模型（如基于核的、低秩的和大型鸟）以缓解其高计算成本，经过在多项任务上的广泛实验，证明了这个模型在语言建模和图像识别方面已经取得了非常优秀的表现。

Abstract

This paper proposes omnidirectional representations from transformers (OmniNet). In OmniNet, instead of maintaining a strictly horizontal receptive field, each token is allowed to attend to all tokens in the enti

omnidirectional representations transformers attention mechanism self-attention models language modeling

发现论文，激发创造

OmniNet: 多模态多任务学习的统一架构

本文介绍了一种名为 OmniNet 的神经网络框架，使用 Transformer、Spatio-temporal Cache 和自我注意机制来支持多模态学习和异步多任务学习，并演示了训练多个任务的模型在保持性能的前提下大幅度压缩的能力。

Jul, 2019

双向关注作为连续单词专家的混合

通过重新参数化，将多层多头的双向注意力视为堆叠的 MoE 和混合的 MoE，从而揭示了双向注意力中使用 MoE 的独特之处，并说明了其在处理异构数据方面的实际有效性。此外，统计视角还揭示了双向注意力的词嵌入中线性类比的限制条件。

Jul, 2023

捕获全向分割的全向范围上下文

本文描述了一种名为 ECANets 的新型神经网络模型，它能够通过捕获全景图像中内在的长程相关性来对城市环境进行分割，以及该模型的训练策略和评估结果。

Mar, 2021

基于注意力机制的神经机器翻译双向分层表示

本文提出了一种层次注意机制的神经翻译模型，采用双向树形编码器来增强源端层次表示，用加权变异的注意机制平衡词汇和短语向量之间的信息，通过树形稀有词编码将该模型扩展至亚字级别以缓解词汇缺失的问题，实证结果表明，该模型在英汉翻译任务中显著优于序列到序列的注意力机制和基于树的神经翻译模型。

Jul, 2017

轻量级图像超分辨率的全局聚合网络

提出了一种名为 Omni-SR 的新型架构，通过增强的 Omni Self-Attention 块和多尺度交互机制来改善轻量级 ViT 框架中 one-dimensional self-attention 建模的局限和同构聚合方案，并在图像超分辨率任务中获得最高记录性能。

Apr, 2023

通过正交内存实现线性关注

通过使用正交内存（LAVO），我们提出了线性注意力方法的一种改进，通过正交分解将上下文压缩为固定大小的正交内存，同时最小化上下文中的冗余，并通过嵌入相对位置编码来改善外推能力。实验证明，LAVO 极大地提高了因果语言模型的效率，并在最佳外推性能上优于其他高效方法。

Dec, 2023

S-Omninet: 结构化数据增强的通用多模态学习架构

本文扩展和改进了 Omninet 体系结构，引入了交叉缓存注意力、整合视觉输入的补丁嵌入和支持结构化数据，提出了增强型结构化数据 Omninet (S-Omninet) 模型，能够通过交叉缓存注意力和补丁嵌入在各维度的结构化数据和非结构化数据之间实现有效的相互作用。作者在多模态数据集上评估了所提出的模型，证明相比基准 Omninet 有了显著的性能提升。

Jul, 2023

变形金刚是元强化学习算法

本文介绍了 TrMRL，这是一种运用 Transformer 架构的基于元强化学习的代理（Meta-Reinforcement Learning Algorithm），它结合了最近的工作内存以递归方式构建情境记忆，并利用 self-attention 机制计算和提供有意义的特征以执行最佳任务。研究表明，在高维连续控制环境下，TrMRL 相对于基线模型表现出了相当或优异的收敛性能、采样效率和超出分布范围的概况。

Jun, 2022

野外 OCR 用带有注意力模型的递归循环网络

提出了一种使用递归循环神经网络、卷积神经网络和软注意力机制的方法，可以在自然场景图像中进行无词典光学字符识别，并在多种数据集上表现出最先进的性能。

Mar, 2016

PoNet: 长序列中高效的令牌混合池化网络

本文提出了一种新的 Pooling Network (PoNet)，它使用线性复杂度的 token mixing 处理长序列，通过多粒度池化和池化融合来捕获不同级别的上下文信息，并结合 tokens 进行交互来提高模型性能。在长范围竞技基准测试中，PoNet 显著优于 Transformer，同时实现与最快模型 FNet 相当的准确性，在 GPU 上度量所有序列长度时仅比最快模型慢一点。同时文章也进行了系统的研究，证明了 PoNet 设计的多粒度池化和池化融合的加强长序列的 token 混合以及设计的预训练任务可用于学习可转移的上下文化语言表示的有效性。

Oct, 2021