关键词deformable convolutions
搜索结果 - 9
- DAS:一种用于捕获 CNN 中显著信息的变形注意力方法
DAS 是一种快速且简单的全卷积方法,通过使用可变形卷积进行图片中相关区域的定位和可分离卷积实现高效,结合了现有 CNN 并通过门控机制传播相关信息,展示了在图像分类和目标检测领域,DAS 相较于其他 CNN 注意机制在减少 FLOPs 的 - ICCV基于人类灵感的人脸草图合成与动态调整
基于人类灵感的动态调整方法(HIDA):通过联合考虑面部 3D 几何和 2D 外貌,以及全局一致的样式控制,基于变形卷积生成抽象和独特的轮廓,实现面部素描的高质量生成,并在多种风格中显著优于先前方法。
- 基于可形变卷积和 LSTM 的灵活事件帧融合网络用于动态去模糊
本研究提出了一种使用 LSTM-based event 特征提取模块的 Deformable Convolutions 网络,以灵活地融合动态变化的事件帧,能够在光照条件或场景中存在快速移动物体的情况下优于现有的运动去模糊网络。
- 手写文字识别的 2D 自组织 ONN 模型
本研究提出了一种新的神经网络模型,其中包含了 2D 自组织 ONNs 和可变形卷积。在 IAM 英语数据集和 HADARA80P 阿拉伯语数据集上,将 Self-ONNs 操作层与可变形卷积相结合,大幅减少了字符错误率和词错误率,且性能显著 - 使用可变形卷积进行单层特征到特征预测
本文提出基于特征预测的方法,用于自动驾驶等决策系统中对未来帧像素的预测,进而提高模型的性能表现,实现在 Cityscapes 测试数据集上的 state of the art 表现。
- 从稀疏标注的视频学习时态姿态估计
通过对稀疏标注的训练视频进行 PoseWarper 网络训练,提出了一种减少需要稠密注释的方法,并借助变形卷积来隐式学习姿态变形,从而在全视频范围内生成姿态注释,并可能改善姿态估计的准确性。
- ICCVKPConv:用于点云的灵活可变形卷积
Kernel Point Convolution(KPConv)是一种新的针对点云进行卷积的设计,其卷积权重位于欧几里得空间中的核点,能够适应任意数量的核点,由于其具有连续性,可以学习适应局部几何特征的形变卷积,并可用于许多复杂和简单任务的 - 通过检测学习有区别的运动特征
该研究提出了一种学习过程,使得检测模型能够从 RGB 视频数据中直接学习运动特征,我们在空间和时间上利用了可变形卷积来预测人的姿势,这自然地鼓励我们的网络学习编码两帧之间空间对应关系的运动偏移量,这些运动偏移量称为 DiMoFs(区分运动特 - 使用时空采样网络的视频物体检测
本文提出了一个名为 Spatiotemporal Sampling Network (STSN) 的模型,使用了时间上的可变卷积,在视频中进行目标检测。通过从相邻的帧中学习空间采样特征,本文展示了 STSN 具有鲁棒性,并且不需要额外的监督