- MADiff:离线扩散模型多智能体学习
本文提出 MADiff,一种基于关注力扩散模型的创新多智能体学习框架,用于模拟多智能体间的复杂协调,以发挥扩散的强大的生成能力。实验证明 MADiff 相比基线算法在各种多智能体学习任务中具有较高的性能。
- IJCAI自监督行为识别的部位感知对比学习
提出一种基于关注机制的对比学习框架,用于骨架序列的表征学习,因为人体动作特征的语义区分常常由局部身体部位表示,如腿部或手部等,这对于基于骨架的动作识别是有优势的,并且该方法通过学习软注意力蒙版特征和生成大量的对比对来增强对局部特征相似性的学 - 基于注意力机制的神经元元胞自动机
本文介绍了一种名为 Vision Transformer Cellular Automata(ViTCA)的定义在细胞自动机框架内基于自注意力机制的人工神经网络,并比较了其在线性降噪自编码任务上与其他神经网络的性能。
- 基于双重注意力机制的植物病虫害识别轻量级网络
该研究提出了一种基于双重注意力机制的轻量级深度学习方法,可自动分类不同的植物病害,该方法在三个公开数据集上分别达到了 96.61%、99.08% 和 91.60% 的准确度,并在小型和大型数据集上均显著优于现有方法。
- 学习音频文本协同以实现开放式关键词定位
本文提出一种新颖的端到端的用户定义关键词检测方法,利用语音和文本序列之间的语言对应模式,实现音频和文本表征在共同的隐含空间中;采用基于注意力的跨模态匹配方法,训练具有单调匹配损失和关键词分类损失的模型,并利用去噪损失改善模型在嘈杂环境中的稳 - ACL利用 Transformer 中的归纳偏置基于 VAEs 无监督地解离句法和语义
该研究提出了一种生成模型,展示了句法和语义的解耦合潜在表示,通过 Transformers 中注意力机制的归纳偏差生成文本,证明该模型对语法和语义具有明显的解耦效果,与有监督模型相比,具有较高的语法传递能力。
- 基于双向注意力对多模态情感识别的群门融合
本文提出了一种新的模型 —— 门控双向对齐网络(GBAN),该模型利用注意力机制的双向对齐网络和一种新颖的分组门控融合层来明确捕捉语音和文本之间的对齐关系,并在不同模态中集成表示,从而在 IEMOCAP 数据集上优于现有的最先进的多模态方法 - 场景生成的组合变形器
GANformer2 采用显式和强有力的结构先验,通过一个序列式的过程合成图像,在多个数据集上成功表现出了最先进的性能,该模型从初始草图到最终的高清晰度图像,提供了图像产生的深入洞察。
- 场景文本识别的表示和相关性增强的编码器 - 解码器框架
本论文提出一种基于注意力的编码 - 解码框架,通过特征提取和融合,利用多头注意力加强了场景和文本特征空间的相关性,进而实现对文本识别领域不规则数据集的更好性能。
- 基于注意力层次多模态融合的高分辨率深度图像成像
本文提出了一种基于注意力机制多模态融合的层次结构深度图超分辨率网络,可以有效地从低分辨率深度图和高分辨率 RGB 图像中提取并组合有价值的特征以实现超分辨率重建。
- SCOUTER: 基于槽位注意力机制的分类器,用于可解释的图像识别
提出一种透明而准确的基于插槽注意力的分类器 SCOUTER,重要特点是提供了直观的解释,并且所有类别都有相应的正面或负面解释,可在大小不同的数据集上提供更好的视觉解释。
- 基于注意力机制的低光图像增强网络
本文提出了一种基于关注机制的神经网络方法,通过通道关注和空间关注模块抑制色差和噪点,以及使用倒置洗牌池化层选择有用信息,实现从原始传感器数据生成高质量的低光图像增强,表现优异,特别是在低光条件下存在严重噪声时。
- 歌声合成:借助注意力的一点帮助
UTACO 是一种基于注意力机制和精简的神经网络构建的歌唱合成模型,相比前人的模型需要的人声特征建模较少,自主学习添加音乐背景下的 vibrato,但完全放弃了时间建模会影响音乐节奏的精度。
- AAAIFFA-Net:用于单幅图像去雾的特征融合注意力网络
本文提出了一种端到端的特征融合注意力网络 (FFA-Net) 直接还原无雾图像,该结构在关注机制、残差学习和特征融合等多方面进行了改进,最终在单幅图像去雾方面取得了最新的最好结果。
- MASTER: 场景文字识别的多方位非局部网络
提出了一种基于自注意力的场景文本识别器 ——MASTER。相比于基于 RNN 的编码器 - 解码器体系结构,该模型通过学习 1d 或 2d 注意力来利用更紧凑的中间表示,在编码器和解码器内部学习自我注意力,从而解决了关注漂移和低效率的问题。
- CVPR基于注意力机制的图像压缩后处理卷积神经网络
提出了一种基于注意力机制的卷积神经网络用于低码率图像压缩的后处理,该后处理模块采用 MAE 和 MS-SSIM 损失训练,在 0.15 比特率下平均 PSNR 最高可达 32.10。
- 基于序列到序列模型的直接语音到语音翻译
该研究提出了一种基于注意力机制的端到端学习的序列到序列神经网络,能够直接将一种语言的语音翻译成另一种语言的语音,无需中间文本表示,该方法通过学习将语音谱图映射到目标语言的谱图,同时也演示了译后语音合成的能力。研究在两个西班牙语到英语的语音翻 - AAAIAFS:一种基于注意力机制的监督特征选择方法
本研究提出了一种新颖的神经网络特征选择体系结构,称为基于注意力机制的特征选择(AFS),它包括两个可分离的模块:特征权重生成的注意力模块和问题建模的学习模块。 通过实验结果,AFS 在与多种最先进的特征选择算法的比较中表现出最佳的精度和稳定 - IJCAI神经机器翻译中的短语表作为推荐记忆
本文提出了一种使用短语表作为推荐记忆来缓解神经机器翻译中生成流畅但不忠实的问题的方法,实验结果表明,该方法在注意力机制的基础上取得了显著的改进。
- ACL零样本序列标注:从句子向标记传递知识
本论文通过构建基于软注意力机制的神经网络架构,分别在四个不同数据集上训练和测试,探究使用注意力或梯度可视化技术能否用于推断二元序列标记问题中的单词级标记,并得出结论:相比梯度 - based 方法,基于注意力的方法能够更准确地预测单词级标记