- CVPR流式视频密集字幕
提出了一种用于密集视频字幕生成的理想模型,能够处理长时间视频输入、预测丰富详细的文本描述,并且能在整个视频处理完成之前生成输出,通过引入聚类处理令其能够处理任意长的视频,并设计了一种流式解码算法使模型能够提前进行预测,实验证明了该模型在三个 - 上下文增强的单图像目标检测转换器
我们提出了一种新颖的单图像目标检测方法,称为 Context Enhanced TRansformer (CETR),通过将时间上下文引入 DETR 并使用新设计的内存模块。
- AAAI通过语义组件级解析提升草图识别可解释性
通过构建一个语义组件级别的记忆模块,本文提出的结构化素描识别网络可以增强识别网络的解释能力,并可以处理带有或不带有语义组件标签的素描识别情况。在 SPG 和 SketchIME 数据集上的实验证明了记忆模块的灵活性和识别网络的解释能力。
- Recall and Learn: 数学问题记忆增强求解器
本文介绍了一种人类模拟学习的方法,利用记忆模块、表征模块、类比模块和推理模块来解决数学文字题,实验结果表明该算法比其他现有算法表现更好。
- WWWMemStream: 基于内存的流式异常检测
本文提出了 MemStream,一种流异常检测框架,使用去噪自编码器和内存模块来检测和适应于不断变化的数据趋势,以应对流式数据中的异常情况和概念漂移,并通过实验结果证明其有效性。
- 快速视频语义分割的局部内存注意力
本文提出了一种新颖的神经网络模块,可以将现有的单帧语义分割模型转化为视频语义分割流水线,并将过去帧中的语义信息聚合到内存模块中,并通过关注机制来对其进行访问。通过将这些提示与当前帧的编码进行融合,可以改善 Cityscapes 数据集上的分 - CVPRMANTRA:用存储增强网络进行多轨迹预测
本论文提出了一种基于记忆增强神经网络的多模态轨迹预测方法,该方法可以在复杂场景中安全地规划自主车辆路径,并且通过非参数化的记忆模块,可以不断改进预测效果。
- CVPR学习记忆引导的正常性用于异常检测
本文提出了一种基于无监督学习的异常检测方法,其中使用内存模块记录正常数据的原型模式,并提出了新的特征紧凑性和分离性损失来训练内存以提高区分能力和识别准确性。该方法在标准基准测试中表现良好,优于现有技术。
- ICCVCapsuleVOS: 使用胶囊路由的半监督视频物体分割
本文提出一种基于胶囊网络的半监督视频目标分割方法,由引入路由算法实现基于感知机的快速选择和基于循环网络的记忆模块解决了视频中小目标和目标遮挡问题,在 Youtube-VOS 数据集上的表现优于现有离线方法并具有比竞争方法快近一倍的运行时间。
- CVPR开放式复合领域自适应
本文提出了一种基于课程域适应策略和记忆模块的方法,以处理由多个同质域组成的无标签复合目标域的开放复合域适应问题。实验证明我们的方法在数字分类,面部表情识别,语义分割和强化学习上非常有效。
- ICCVEMPNet: 使用嵌入式记忆点的神经定位与建图
本文研究了使用内存模块进行环境表示的方法,其中包括利用卷积神经网络提取点嵌入并将其刚性对齐,从而提高智能体的自主能力和准确性。
- CVPR使用自组织记忆模块学习网络数据
本文提出了一种新颖的方法,通过多实例学习框架将同一类别的 ROIs (即图像及其区域提议) 分组,并基于其最近集群的代表性 / 差异性分数分配不同的权重来处理噪声问题,包括标签噪声和背景噪声,并将记忆模块与分类模块自然集成在一起,取得了令人