- SOOD++:利用无标签数据提升有向物体检测
通过使用无标签数据提升目标检测器的半监督方法,我们提出了一种简单而有效的半监督定向目标检测方法 SOOD++,该方法在多方向对象和航拍图像方面获得了较好的结果。
- 三维 CAD 模型特征提取的基于集合方法
基于集合的特征提取方法应用于 CAD 模型,将几何信息的不确定性转化为一组特征子图,并通过确定特征边界和识别特征子图来实现特征提取系统。
- 基于范围图像的点云分割中缺失值的填充的重要性
点云分割在机器人感知和导航任务中起着重要作用,本文提出了一种新的投影方法,以及简单有效的填充方法,并介绍了两个网络模型,通过采用这些方法,现有的基于范围图像的点云分割模型在性能上取得了明显的改善。
- GeoReF: 类别级别物体位姿细化的形状变化间的几何对齐
本研究提出了一种新的框架用于类别级目标姿态细化,通过整合 HS 层和可学习仿射变换来增强几何信息的提取和对齐,同时引入了跨云变换机制来高效合并多样化数据源,并在翻译和尺寸误差预测中应用形状先验信息,通过大量定量实验证明了所提出框架在所有评测 - 推进几何问题求解:多模型评估的全面基准
通过 MM-MATH 数据集,该研究旨在评估多模态模型在几何计算领域的性能,发现当前模型从图像中解析和解释几何信息存在显著不足,强调评估方法应包括推理和过程正确性,以填补文本和图像理解方面的关键差距,以此激发进一步研究和发展,推动多模态模型 - ConDaFormer:用于三维点云理解的局部结构增强的分解式 Transformer
将局部几何结构和长范围上下文信息耦合进 ConDaFormer 中,通过将相应的立方体窗口分解为三个正交的 2D 平面,以在类似范围内建模注意力,提高了性能和模型的计算效率。
- HCA-Net:用于椎间盘语义标记的分层上下文注意力网络
通过 HCA-Net 体系结构,我们提出了一种新的语境注意力网络来进行椎间盘(IVD)的语义标注,特别关注利用先前的几何信息。通过将 IVD 标记作为姿势估计问题,我们的方法通过最小化每个预测 IVD 位置与其相应的实际关节位置之间的差异来 - 多视角几何变换器用于 3D 人体姿态估计
我们的研究旨在提高 Transformer 的三维推理能力,在多视图三维人体姿势估计中。通过引入一种新的混合模型,MVGFormer,该模型采用一系列的几何和外观模块,以迭代方式组织。其中,几何模块通过几何方式处理依赖于视角的三维任务,显著 - ICCVGACE:基于几何感知的 LiDAR 数据黑盒 3D 物体检测器的置信度增强
在广泛使用的基于 LiDAR 的三维物体检测中,由于架构设计选择通常是从二维图像领域采用,很容易忽略从物体提案中获得的基本几何信息。而在三维中,综合考虑物体属性和其周围环境对于区分真伪正检测是重要的,为此我们提出了 GACE,这是一种直观高 - 几何消除:基于几何的扩散模型中隐含概念的去除
通过个性化数据集对扩散模型进行微调是一种被认可的方法,可以在下游任务中提高生成质量,然而,这种方法常常会无意中生成水印和 QR 码等意外概念,这是由于特定下游任务中图像来源和收集方法的限制所引起的。我们提出了一种新方法,即 methodna - Traj-LO: 高效连续时间轨迹的仅激光雷达导航定位
通过连续时间视角探索 LiDAR 单独里程计的能力,我们提出的 Traj-LO 方法通过紧密地结合 LiDAR 点的几何信息和轨迹平滑度的运动约束,恢复了 LiDAR 的时空一致性移动。该方法在不同种类的 LiDAR 以及多 LiDAR 系 - CVPR通过草图绘制学习具备几何意识的表示
LBS 学习通过绘画来表示场景,而不需要素描数据集。理论上证明绘画与任意仿射变换具有等变性,因此可以保留几何信息。实验结果显示 LBS 显着改善了对象属性分类的性能,并为不同下游任务提供了丰富的几何信息。
- 交互式生物分子系统的图表示学习
本文综述了用于表示生物分子和系统的计算机可识别对象的方法学,特别是强调基于图形技术的几何深度学习模型如何分析生物分子数据以实现药物发现,蛋白质表征和生物系统分析,最终总结了该领域的当前状况以及存在的挑战和未来研究方向。
- 通过位置去噪预测易于获得的几何量子化学性质
本文提出了采用分层去噪方法预测量子化学性质的方法,以优化几何结构为输入,解决高级量子力学计算的不可行性问题,实现了在两个预测任务中取得了较高的准确性。
- 嵌入复合体的不变表示
提出了一种新的方法,利用拓扑和几何信息,仅仅使用统计数据和图神经网络就能对嵌入的单纯复合体进行无细分和等距不变分析。利用合成网格数据集证明了该方法的有效性。
- ICLR在点云中重新思考网络设计和本地几何:一个简单的残差 MLP 框架
本文提出了一种名为 PointMLP 的纯残差 MLP 网络,它不使用复杂的局部几何提取器,但仍能表现出很高的竞争力,装备了提出的轻量级几何仿射模块,PointMLP 在多个数据集上都达到了新的最佳状态,相对于大多数最近的 CurveNet - 在移动声音的复杂未被地图化的环境中进行音频 - 视觉导航
本文提出了动态视听导航基准,介绍了融合空间特征的视听信息的体系结构,并通过强化学习方法学习了复杂环境下的稳健导航策略,研究表明,该方法在捕捉移动声源、未知声源和嘈杂环境方面具有显著的性能优势。
- 独特的三维本地深度描述符
提出了一种使用 PointNet-based 深度神经网络学习具有区分性的 3D 局部深度描述符 (DIPs) 的简单而有效的方法,该方法可用于在不需要初始对齐的情况下注册点云。
- CVPR使用视差图进行几何感知的实例分割
利用双目摄像机的传感器融合提高室外图像的对象分割,通过几何信息的利用,可以区分重叠的同类或异类物体,并抑制虚假检测,该方法的融合过程基于面罩评分,采用伪激光雷达和基于图像的表示进行 2D、2.5D 和 3D ROI 上的面罩回归。通过使用具 - CVPRSharinGAN:结合合成和真实数据进行无监督几何估计
本文提出了一种将合成图像和真实图像结合进行网络训练的新方法。我们建议将两种图像映射到一个共享域中,并连接到主网络进行端到端训练。实验结果表明,该方法在两个重要的领域中均取得了显著的改进:人脸表面法线估计和户外场景单眼深度估计,尤其是在无人监