关键词end-to-end trainable
搜索结果 - 35
  • 通过阅读顺序估计和动态采样实现类似逆操作的场景文本定位
    PDF6 months ago
  • ICCVMMVP: 基于动态矩阵的视频预测
    PDF10 months ago
  • 联合优化图像压缩与低光图像增强
    PDFa year ago
  • SurgicalGPT: 外科视觉问答的端到端语言 - 视觉生成预训练模型
    PDFa year ago
  • CVPR连接点:使用双层查询进行平面图重建
    PDF2 years ago
  • 一种基于张量融合层的自发语音痴呆检测的多模态方法
    PDF2 years ago
  • 通过深度对象解析实现细粒度少样本识别
    PDF2 years ago
  • YOLO-Pose: 使用物体关键点相似性损失增强 YOLO 进行多人姿态估计
    PDF2 years ago
  • 端到端的活跃说话人检测
    PDF2 years ago
  • CVPR针对多人姿态估计的学习本地化 - 全局上下文适应
    PDF3 years ago
  • ICCVPatchMatch-RL:利用像素级深度、法线和可见性的深度多视角重建
    PDF3 years ago
  • 基于分割的场景图生成
    PDF3 years ago
  • CVPRLED2-Net:基于可微深度渲染的单目 360 布局估计
    PDF3 years ago
  • TrackFormer:基于 Transformer 的多目标跟踪
    PDF3 years ago
  • 用卷积自编码器填充人体运动
    PDF4 years ago
  • MAFF-Net:使用多模式自适应特征融合过滤 3D 车辆检测的误报
    PDF4 years ago
  • ECCV通过可区分裂片检索实现图像合成的 RetrieveGAN
    PDF4 years ago
  • STEm-Seg:视频中的时空嵌入实例分割
    PDF4 years ago
  • CVPR多尺度和上下文自适应熵模型用于图像压缩
    PDF5 years ago
  • 使用引导注意力在视频中进行自然语言查询的无需提议的时间时刻定位
    PDF5 years ago
Prev