关键词end-to-end trainable
搜索结果 - 35
- 通过阅读顺序估计和动态采样实现类似逆操作的场景文本定位PDF6 months ago
- ICCVMMVP: 基于动态矩阵的视频预测PDF10 months ago
- 联合优化图像压缩与低光图像增强PDFa year ago
- SurgicalGPT: 外科视觉问答的端到端语言 - 视觉生成预训练模型PDFa year ago
- CVPR连接点:使用双层查询进行平面图重建PDF2 years ago
- 一种基于张量融合层的自发语音痴呆检测的多模态方法PDF2 years ago
- 通过深度对象解析实现细粒度少样本识别PDF2 years ago
- YOLO-Pose: 使用物体关键点相似性损失增强 YOLO 进行多人姿态估计PDF2 years ago
- 端到端的活跃说话人检测PDF2 years ago
- CVPR针对多人姿态估计的学习本地化 - 全局上下文适应PDF3 years ago
- ICCVPatchMatch-RL:利用像素级深度、法线和可见性的深度多视角重建PDF3 years ago
- 基于分割的场景图生成PDF3 years ago
- CVPRLED2-Net:基于可微深度渲染的单目 360 布局估计PDF3 years ago
- TrackFormer:基于 Transformer 的多目标跟踪PDF3 years ago
- 用卷积自编码器填充人体运动PDF4 years ago
- MAFF-Net:使用多模式自适应特征融合过滤 3D 车辆检测的误报PDF4 years ago
- ECCV通过可区分裂片检索实现图像合成的 RetrieveGANPDF4 years ago
- STEm-Seg:视频中的时空嵌入实例分割PDF4 years ago
- CVPR多尺度和上下文自适应熵模型用于图像压缩PDF5 years ago
- 使用引导注意力在视频中进行自然语言查询的无需提议的时间时刻定位PDF5 years ago
Prev