- 单试验脑电图类别解码中的示范性表示学习
研究对神经影像学的研究中,通过重复试验的方法对实验进行了分析,发现由于信息泄漏的缘故,一些已发布的模型的真实可推广性可能被夸大了。
- 利用自监督学习学习对象语义相似性
通过模拟时间序列的视觉经验,结合既视感与语言的对齐,我们的研究表明时间和既视感对齐是解释人类某些形式的语义知识起源的可能计算原理。
- CVPRSUGAR: 为机器人预训练 3D 视觉表征
通过名称为 SUGAR 的新型 3D 预训练框架,可以捕捉物体的语义、几何和功能属性,解决了处理复杂 3D 场景中的遮挡和准确定位对象的亚优缺陷;SUGAR 利用可变转换模型同时处理五个预训练任务,包括语义学习的跨模态知识蒸馏、理解几何结构 - GS-Pose:通用分割 6D 物体位姿估计的级联框架
GS-Pose 是一个端到端的定位和估计物体 6D 姿态的框架,通过构建三种不同的表示形式,利用逐步定位、检索方法和渲染比较方法,以适应各个阶段的合适物体表示,并利用可用的工具链和常见硬件进行新对象的数据捕捉和数据库添加。在 LINEMOD - FoundPose: 基于基础特征的未知物体姿态估计
利用 FoundPose 方法可以从单个 RGB 图像中准确估计看不见的刚性物体的 6D 姿态,方法基于 DINOv2 模型实现泛化能力强,通过 DINOv2 基于词袋模型快速检索相似模板,从而建立 2D-3D 对应,最后通过特征度量优化姿 - RTrack: 通过伪框探索加速视觉目标跟踪的收敛
本文介绍了一种名为 RTrack 的新型目标表示基准追踪器,该追踪器利用一组样本点来获取伪边界框,并自动排列这些点以定义空间范围和突出显示局部区域。我们还对训练潜力进行了深入研究,并引入了一对多的前导分配策略,该方法在 GOT-10k 数据 - 从视频中使用 3D 表示跟踪物体
该论文探讨了在 2D 多目标跟踪中的数据关联问题,并借鉴 3D 目标表示来解决这一问题,提出了一种新的基于 Pseudo 3D 标签的 2D MOT 方法 P3DTrack,通过视频数据自学习 3D 目标表示,并在 Waymo 开放数据集上 - 一个物体 SLAM 框架:关联、映射和高级任务
本文提出了一种综合的基于物品的感知和基于物品的机器人任务的物体 SLAM 框架,专注于解决 SLAM 中的数据关联、物体表示和语义地图问题,并通过公开数据集和真实世界结果对其性能进行了评估。
- BPJDet:通用身体部件关节点扩展目标表示
本文提出了一种基于 CNN 的新型扩展目标表示法,将人体部位的中心偏移量集成到一个统一的对象表示中,并构建了一种密集的一阶通用身体 - 部位联合检测器 (BPJDet),利用多任务优化来处理多项任务,以实现身体部位的联合检测,从而改进了人体 - CVPR基于条件神经过程的类别无关 6D 位姿估计
本研究提出了一种新颖的基于元学习的方法,用于对未知对象进行六自由度姿态估计,并通过条件神经过程元学习训练将纹理和几何特征编码到隐向量空间,用于在新图像中预测对象的六自由度姿态,实验证明该算法在不同形状和外观的未见对象上具有强大的泛化能力。
- 神经描述符域:SE(3)- 等变物体表征用于操作
提出了神经描述器场(NDF),一种通过类别级别描述符编码物体和目标(例如机器人夹子或挂架)之间的点和相对姿态的物体表示。通过自我监督学习 3D 自编码任务来方便地训练 NDFs,并将其用于从少量示范中学习物体操作任务,具有跨越所有可能的 3 - 用符号距离场学习模型进行操作规划
本文提出了一种基于优化的操作规划框架,其中目标是学习表示场景中物体的符号距离场的学习功能。我们通过代表物体的符号距离场来展示表示对象的方法不仅可以学习和表示多种模型,而且比点云和占用度量表示具有更高的准确性,并适用于基于优化的规划。我们通过 - ICCVSAT: 2D 语义辅助的 3D 视觉定位训练
该研究提出了 2D Semantics Assisted Training(SAT)来提高 3D 视觉定位的准确性,通过学习丰富,干净的 2D 对象表示与 3D 场景中的对象或提到的实体之间的对齐关系,辅助 3D 视觉定位,将 2D 语义有 - kPAM 2.0:类别层次机器人操作的反馈控制
本文中,我们探讨了可推广的感知行动机器人操纵,解决了一类物体操作的自动化,实现了接触丰富的操作任务,提出了一种基于关键点的物体表示方法,并扩展为闭环操作策略。我们提出了一种新颖的以物体为中心的动作表示方法,它可以完成需要精度和灵巧性的接触丰 - ICLR利用区域提议交互网络学习长期视觉动态
本论文通过 Region Proposal Interaction Networks 的方法在潜在区域建立对象表示来捕捉对象间和对象环境交互,并在长期预测中尤为有效,提高了预测质量和规划下游任务的能力,同时在新环境中具有良好的泛化性能。
- 密集型 RepPoints:使用密集点集来表示视觉对象
本文提出了一种新的物体表示方法 ——Dense RepPoints,它利用大量点对物体进行多层次描述,包括边框层次和像素层次。同时介绍了一些有效的处理此类密集点的技术,其中利用距离变换采样方法结合集合到集合的监督学习来学习物体部分,距离变换 - kPAM-SC: 使用关键点可操作性和形状补全实现通用的操纵规划
该论文研究了在存在大量形状差异的物体类别中,如何使用高效的物体表示方式和机器学习方法,实现基于感知输入的机器人运动规划,来完成任务。
- 对比学习中的在线目标表示
该论文提出了一种自监督学习的方法,用于从单目视频中学习物体的表征,并证明其在机器人等实践中具有特殊的用途。
- CVPR无监督基于部件的物体形状和外观解耦
提出了一种基于无监督学习的方法,通过学习物体的不同特征,如表现和形状,来实现特征的分离和表示,并使用等变约束进行训练,适用于任意类别,并在各种任务中表现优异。
- 全局不变性下的最优输运
该论文提出了一种在潜在的全局转换情况下进行离散最优传输的通用框架,并通过采用灵活类的不变性来选择转换进行联合最优化求解,成功解决了包括无监督词汇翻译基准在内的各种任务。