- 透明物体深度补全
我们提出了一种透明物体深度补全的端到端网络,结合了基于单视图 RGB-D 的深度补全和多视图深度估计的优点,并引入了基于置信度估计的深度细化模块,进一步改进了恢复的深度图。在 ClearPose 和 TransCG 数据集上进行的大量实验证 - CVPR走向真实世界的 HDR 视频重建:一个大规模基准数据集和两阶段对齐网络
提出了一个大规模真实世界的高动态范围(HDR)视频重建基准数据集 Real-HDRV,其中包含 500 个低动态范围(LDR)- 高动态范围(HDR)视频对,结合了全天候、室内和室外等各种场景,提出了一种使用新型的两阶段策略进行全局和局部对 - FM-AE:用于锌电解板接触异常检测的频率屏蔽多模态自编码器
为了确保生产质量和效率,文章提出了一种将细胞电压信号和红外图像信息作为输入的端到端网络 ——Frequency-masked Multimodal Autoencoder(FM-AE)。通过自动编码将这两种特征融合在一起,并通过级联检测器预 - P2CADNet:用于点云参数化三维 CAD 模型的端到端重建网络
该研究提出了一种从点云中重建特征 CAD 模型的端到端网络 (P2CADNet),通过结合点云特征提取器、CAD 序列重构器和参数优化器等模块来实现 CAD 模型的精确重建。实验结果表明 P2CADNet 具有出色的重建质量和准确性,并且是 - 治疗感知扩散概率模型用于纵向 MRI 生成和弥散性胶质瘤生长预测
扩散性胶质瘤的成长建模具有挑战性,本论文提出了一种新颖的端到端网络,可生成未来肿瘤掩模和不同治疗计划下肿瘤在任何未来时间点的真实磁共振成像。该模型基于尖端的扩散概率模型和深度分割神经网络,通过扩展扩散模型以包括顺序多参数 MRI 和治疗信息 - CMG-Net: 一种端到端基于接触的多指灵巧抓取网络
本论文提出了使用多指机器人手和被操作物体之间的接触来表示抓取的新方法,并通过一个端到端的网络实现在杂乱环境中抓取未知物体的目标。同时,我们创建了一个包括五千个场景的综合数据集,并进行了全面的实验研究,实验结果表明,我们的方法表现优于目前最先 - ECCV深度字典图像超分辨率
通过提出基于深度字典(SRDD)的端到端超分辨网络,可以具有更好的泛化性能,包括高分辨率词典的显式学习,从而在不损失深度学习优势的情况下更好地处理不在训练集中的图像。
- CVPRSaiNet: 带有生成网络的立体感知物体遮挡修复
本研究提出了一种端到端的网络,旨在利用基于 Partial Convolutions 的边缘引导 U-Net 网络填充大面积部分,通过引入视差损失实现多视图立体一致性,采用真实立体遮罩训练,结果显示与之前的技术相比有一定的竞争优势。
- WWWTransCG:透明物体深度完成和抓取基线的大型实际数据集
本研究提供了一种基于深度学习网络的方法,针对普通深度传感器获取透明物体深度信息的难题,构建了一个大规模真实场景数据集,同时提出了一种深度完成网络用于输出精度更高的透明物体深度信息,并且该方法能够成功地应用于机器人对透明物体的抓取。
- 基于生成对抗网络的全卷积变化检测框架,适用于无监督、弱监督和区域监督变化检测
这篇论文提出了一种基于生成式对抗网络的全卷积变化检测框架,它可以将无监督、弱监督、区域监督和全监督变化检测任务整合到一个框架中,并证明了该框架在无监督、弱监督和区域监督变化检测中的有效性。
- 双双模态融合的相关性控制多模态情感分析
该研究提出了一个新的端到端的网络,使用双模态配对表示执行融合和分离,并利用带有门控机制的 Transformer 架构进一步提高了最终输出,在 CMU-MOSI、CMU-MOSEI 和 UR-FUNNY 三个数据集上的实验结果验证了该模型明 - 基于 Transformer 的目标检测
本文提出基于 Transformer 的新方法 O²DETR,实现了复杂的有方向物体检测,无需旋转锚点,其性能表现明显优于 Faster R-CNN 和 RetinaNet。
- CVPR弱而深地监督的遮挡推理参数化路面布局
本文提出一种端到端的网络模型,该模型仅需要较为便宜的人工注释即可在复杂路况下的单个透视 RGB 图像上产生基于遮挡的透视空间布局和参数化鸟瞰图,并用了归纳偏差来学习遮挡推论、几何变换和语义抽象等方面,经测试该方法有效且仅需较少的人工干预。
- Contact-GraspNet: 在混乱场景下高效生成 6 自由度抓取
通过一种端到端的神经网络,将深度记录的场景直接转化为 6 个自由度平行夹具抓取的分布,其独特的抓取表示法将点云的 3D 点作为潜在的抓取接触点,并将 6 个自由度的抓取姿态与宽度根据观察到的点云减少到 4 个自由度,成功率可达 90% 以上 - 高效人员搜索的连续端到端网络
提出了一种基于 Sequential End-to-end 网络和 Context Bipartite Graph Matching 算法来提升 person search 中 re-ID performance 的方法,并在 CUHK-S - EMNLPAIN:具有近似推断网络的快速准确的序列标注
本文介绍了一种基于并行化的近似变分推断算法,用于提高线性链条件随机场模型的训练和预测速度,并将其设计成可连接编码器的端到端网络,在长句子情况下,该方法在准确率不降的情况下将解码速度提高了 12.7 倍。
- 基于可微分特征聚类的图像分割无监督学习
本文研究了卷积神经网络在无监督图像分割中的应用。我们提出了一种新的端到端网络方法,包括归一化和可微聚类函数,解决了前人固定分割边界的局限性。我们还针对用户输入扩展了该方法,同时保持高效性和准确性。经过在多个数据集上的测试,得出了该方法的有效 - CVPR全景分割的训练和推理统一化
我们提出了一种端到端的网络,用于连接全景分割的训练和推理管道,通过使用密集实例亲和力来捕获像素对属于相同实例的概率,并与 ResNet-50 骨干网络配合使用,实现了对 Cityscapes 和 COCO 数据集的新记录。
- CVPR学习从事件中超分辨强度图像
该研究提出一种基于事件流的端到端神经网络,能够从低空间分辨率的事件摄像头中重建出高分辨率,高动态范围的图像,优于现有同类算法,可通过使用主动传感像素框架或迭代重建图像方法进一步扩展。
- AAAI可靠性至关重要:一种端到端的弱监督语义分割方法
本文提出了一种基于图像级别信息的全新弱监督语义分割方法,该方法不需要使用复杂的伪标签生成过程,而是利用图像分类信息产生可靠的像素级别的注释,然后使用全新的稠密能量损失函数和端到端网络进行图像分割。通过拓展基于图像分类信息产生的像素级别注释的