- WWW学习用户偏好的异质时间模式以实现及时推荐
提出了一种新型的推荐系统,TimelyRec,通过考虑用户偏好的不同的时间模式和其他特征(即周期性与演化)来联合学习用户偏好的异质性时间模式并利用一种注意力模块,进而提供及时的推荐,实验结果表明该方法在实现及时推荐时表现出色。
- 基于 Transformer 的零样本序列标注句子分类器
本文研究了如何将句子级 transformer 修改为在没有任何直接监督的情况下有效的序列标记,我们发现一个软性注意模块可以明显优于现有方法,使得能够更好地在标记级别提高性能。
- 人体去遮挡:人的隐形感知与恢复
使用两阶段框架和基于 mask 的网络方法,本文针对人体消失的问题进行研究,提出了一种新颖的注意力模块和收集了 Amodal Human Perception dataset(AHP)来验证我们方法的有效性和优越性。
- 全景意图网络:面向视障人士的高效导航感知
通过提出一种基于 Panoptic Lintention Net 的紧凑可穿戴全景分割系统,协助视障人士高效地获得环境中物品和场景的感知,使用 Lintention 注意模块快速建模长程关联,实现对现实场景的全景分割,获得了较稳定和显著的分 - 视觉语言任务的因果关注
本文提出了一种新颖的注意力机制 Causal Attention (CATT),用于消除现有基于注意力的视觉语言模型中一直存在的混淆效应,CATT 可替换任何注意力模块,可大幅提高各种流行的注意力模型的性能,尤其在大规模预训练中具有潜力。
- 改进的视觉问答注意力机制
本文提出了一种改进的基于注意力机制的架构,其中包括一个对注意力结果和查询进行关系确定的 AoA 模块,并提出了多模态融合模块来组合视觉和文本信息,结果在 VQA-v2 基准数据集上达到了最先进的性能。
- COLING深度标声符号化:用于改进阿拉伯语标声符号化的高效分层循环
本文提出了一种针对阿拉伯文音标的新型网络结构,使用基于词和字符层级的循环神经网络层级结构和交叉层级的注意力机制,进一步提高了网络的可解释性。使用额外技巧如句子 dropout 和多数投票进一步提高了模型性能,使得在 Tashkeela 阿拉 - 提高语义解析中组合泛化能力
本文探究在语义解析中复合泛化的问题,研究了多种模型并提出多种扩展,其中包括使用上下文表示、指导解码器、训练解码器等等,结果发现这些因素有助于促进复合泛化。
- CVPR基于时间组注意力的视频超分辨率
本文提出了一种新颖的视频超分辨率方法,利用分层式的时间信息和注意力机制,在处理大幅运动的视频中具有较好的性能表现。
- 自动驾驶车辆的多模态概率轨迹预测与车道关注
本文提出一种基于实例感知的车道表示法和目标導向车道注意力模型,结合车道特征和车辆轨迹特征进行车辆位置预测,并在 NeurIPS 2019 的 Argoverse 运动预测竞赛中获得第三名,实验证明了模型的有效性。
- 金字塔注意力网络用于图像修复
将金字塔注意力模块用于图像修复能够提高深度卷积神经网络方法的自相似性,从而能够更好地处理在不同尺度上具有类似模式的图像,并可应用于多种图像修复任务中,包括图像去噪、去马赛克、减少压缩伪影和超分辨率。
- CVPR域整理:简化图像缓解合成 - 真实域间的转移并提高深度估计
通过注意力模块,学习识别和去除真实图像中的困难部分,以提高合成数据训练的模型对真实图像的景深估计。
- MAP-Net: 多注意力路径神经网络用于遥感影像建筑物轮廓提取
本文提出了一种新的多路径并行卷积神经网络(MAP-Net)用于从遥感影像中精确提取多尺度建筑物轮廓和精确边界,通过注意力模块和金字塔空间池化模块来学习保持空间本地化的多尺度特征和优化建筑物轮廓,实验表明 MAP-Net 在边界定位精度和大建 - 无监督草图到照片的合成
本文首次研究了无监督的手绘草图到照片的合成,提出了一种两阶段翻译任务的方法,添加自监督去噪目标和注意力模块以处理抽象和风格差异,生成的图片忠实于草图且逼真的,并可实现基于草图的图像检索和捕捉人类视觉感知。
- 语义感知场景识别
该论文提出了一种基于多模式 CNN 的场景识别新方法,结合图像和上下文信息,通过注意力机制来强化学习和增强场景的辨别能力,实验证明该方法性能超过所有现有的先进方法,并显著减少了网络参数。
- ICCV基于注意力机制的 Atari 智能体自由午餐显著性
本文提出了一种新方法,通过添加自由午餐显著性(FLS)的注意力模块将其应用于深度学习代理在 Atari 环境中进行的训练,使网络产生注重分布。通过实验,我们发现网络的性能与基线类似,并且可以作为深度强化学习代理的可替代品。
- MM使用 GAN 进行盲去模糊
本文通过尝试不同的 GAN 结构和对现有结构的各种修改来提高其在监督去模糊中的性能,其中包括使用注意力模块和残差连接,同时添加经典损失函数(L1,L2 和感知损失)来训练 GAN,以及采用反馈模块以保留长期依赖关系。
- ICLRU-GAT-IT:自适应层 - 实例归一化的无监督生成式注意力网络用于图像翻译
本文提出了一种新的无监督图像到图像的转换方法,它通过引入一个新的注意力模块和一个可学习的规范化函数,以端对端的方式来实现。
- 通过空间分离注意力模块改善复合图像的谐调性
本文提出了一个新的注意力模块 SPatial-Separated Attention Module (S2AM) 来学习掩膜区域的特征,并将其与 Unet 结构中的粗略底层特征相结合,实现了一种新的图像和谐框架。根据多方面的标准,实验证明了 - 基于深度空间关注和硬度加权损失的 T2 加权 MRI 听神经瘤自动分割
介绍了一种应用于 vestibular schwannoma MRI 图像的 2.5D 卷积神经网络,该网络利用了所应用成像协议中不同的平面分辨率,使其精度和鲁棒性得到提升,并通过引入注意力机制以及权重逐渐递增的 Dice 损失函数对其进行