超越卷积的优化:利用端到端度量学习推广空间关系
该论文介绍了使用距离度量学习的新方法来解决自主机器人在富含各种空间关系的人类中心环境中的空间关系学习问题,从而使其能够以灵活的方式学习任意的关系并进行泛化,这在非专家用户的辅助下以一个小数量的例子交互式地完成。
Mar, 2017
当前计算机视觉系统在识别实物基础空间关系方面的性能较差,通过提出了精确的关系定义以允许对基准数据集进行一致的标注,并利用 Transformer 模型的长程注意力能力对这一任务提出新的方法进行评估。我们提出了一种名为 “RelatiViT” 的简单架构,并证明其胜过所有当前方法,这是第一种在实际场景中令人信服地优于朴素基准的空间关系预测方法。
Mar, 2024
该论文介绍了一种针对目标导航任务的框架,其中机器人需要从随机起始位置找到并移动到最近的目标对象类的实例。该框架利用机器人轨迹的历史记录来学习空间关系图和基于图卷积网络的嵌入,以便估计不同语义标签区域的接近度以及这些区域中不同的对象类别的出现。在评估期间,机器人使用贝叶斯推断和空间关系图来估计可见区域,并使用已学习的图卷积网络嵌入来排名可见区域并选择下一个探索区域。
Aug, 2022
本文提出了一种基于连续凸损失优化的简单优雅方法,用于线性距离度量学习,并针对不同的噪声模型推导了相应的损失函数。研究结果表明,即使数据存在噪声,只要样本充足就可以学习到地面事实线性度量,并提供相应的样本复杂度限制。此外,我们还提出了一种有效地将学习模型截断为低秩模型的方法,该方法可证明在损失函数和参数方面都能保持准确性,这是该领域首次出现这种结果。实验结果表明了理论结果的正确性。
Jun, 2023
该论文提出了一种新的图相似度度量方法,利用卷积神经网络和谱图理论概念,在不规则图上执行操作,通过对临床应用量身定制的图相似度度量方法,将 k-nn 分类器的性能提高了 11.9%。
Mar, 2017
本文研究基于大规模文本到图像合成 (T2I),研究其中的空间理解能力,并提出了一个评估指标 VISOR,并引入一个大规模的数据集 SR2D 以及自动化评估管道,对 T2I 模型进行了大规模实验,发现其在多对象和空间关系生成方面存在严重限制和偏差,并提供了数据集和评估指标以支持 T2I 空间推理研究。
Dec, 2022
本文引入了一种基于连续标签的深层度量学习新方法,包括使用连续标签进行三元组损失和适应连续标签的三元组挖掘策略,同时实验结果显示该方法在三种不同的图像检索任务中表现出较优异性能。
Apr, 2019
本论文提出一种文本条件化的关系网络模型,通过跨模态的注意力机制动态计算参数以捕获实体之间的精细空间关系,从而实现对文本中空间参照的理解,具有可解释性和鲁棒性,在三个任务中实现了 17% 和 15% 的表现改进,从而解决了在自主导航和机器人控制中学习空间概念表示的关键挑战。
May, 2020
该文章提出了一种新的深度学习目标公式,在小训练集合的情况下能够使得其学习到的深层网络具有较好的泛化能力,同时介绍了一种基于几何感知的深度转换技术,从而实现了非线性、具有鲁棒性的特征转换,该方法在合成和真实数据方面表现良好,并支持所提出的框架使用 (K,ε)- 鲁棒性分析。
Sep, 2015
该研究提出了一种基于几何关系的多目标跟踪方法,通过将 3D 检测编码为图中的节点,并利用图边上的局部极坐标编码表征物体之间的空间和时间关系。在多项测试中,该方法显著超越了现有技术的水平,并在不同的场景和数据集上表现出了很好的泛化能力。
Aug, 2022