- 通过图神经网络检测物体中心业务流程中的异常事件
该研究提出了一种利用图神经网络和面向对象的流程挖掘的框架来检测业务流程中的异常事件,结果表明该方法在活动类型和属性层面上能够很好地检测异常,但在事件的时间顺序上存在困难。
- 学习具有物体为中心的三维表示的可泛化的操作策略
GROOT 是一种基于模仿学习的方法,利用物体中心化和 3D 先验知识来学习鲁棒策略,通过构建鲁棒的物体中心化 3D 表示,并使用基于 Transformer 的策略对这些表示进行推理。此外,我们还引入了分割对应模型,使策略能够在测试时适用 - 使用面向对象的流程挖掘分析售后服务过程的案例研究
通过对约 65,000 个事件的事件日志进行深入的博鲁桑卡特售后服务流程的案例研究,本研究强调了面向对象的过程挖掘能够捕获复杂业务流程细节的能力,突出了其在实际运营场景中潜在而尚未充分开发利益。
- OTAS: 无监督的面向对象的时间动作分割的边界检测
我们提出了一种名为 OTAS 的无监督框架,通过探索局部特征的优点,实现了时域行为分割,并通过自监督全局和局部特征提取模块以及边界选择模块,融合特征并检测行为分割的显著边界。在实验中,我们发现 OTAS 相对于推荐的 F1 分数平均提高了 - 概念中心 Transformer:基于物体概念学习的概念 Transformer,用于可解释性
我们提出了以目标为中心的 “Concept-Centric Transformers”(CCT),通过整合基于面向对象学习的新型概念提取模块,提供更强大的解释性和性能,与 CT 和其他现有方法在 MNIST(奇偶),CIFAR100(超类) - SNeRL: 语义感知神经辐射场与强化学习
本论文提出了一种基于视角图进行神经元无关表示的方法,使用语义感知的神经辐射场和卷积编码器共同地学习三维感知神经元隐式表示,在强化学习中实现语义感知的表征。
- 从以对象为中心的事件数据中提取和编码特征的框架
本文介绍了从对象中心事件数据中提取和编码特征的通用框架,提供了表格、序列和基于图形的编码,用于预测模型的实用性。
- 定义针对以对象为中心的事件数据的案例与变体
介绍了面向对象的过程挖掘中的过程执行概念,其是传统过程挖掘中的 case 概念的图形扩展,提供了提取过程执行的技术和可视化技术,并通过图同构确定了 respect 属性的等效过程行为。对实际操作数据进行了评估和案例研究。
- ECCVShAPO: 多目标形状、外观和姿态优化的隐式表征
该研究提出了一种用于目标识别、3D 萃取、6D 姿态和大小估计的多任务检测流水线 ——ShAPO,其利用单激光雷达管道、分别处理形状、外观和姿态潜在编码以及各个实例的掩码进行多目标检测。在学习对象的形状和外观空间时,还建议了一种新型的解缠绕 - ObPose:利用姿态进行三维物体中心场景推理
ObPose 是一个无监督的对象中心推理生成模型,可以从 RGB-D 场景中学习三维结构的潜在表示,并通过将对象位置和外观分开编码来获得卓越的性能。
- 非监督式物体光场的发现与合成
本文提出了一种基于光场的物体中心化组合场景表示法,通过无监督的方式学习神经场景表示,显著提高了场景渲染的速度和质量。
- ICML生成式视频变压器:物体能否成为语言的基本单位?
本文介绍了一种利用 “Object-Centric” 思想的视频生成器 ——Object-Centric Video Transformer(OCVT)模型,该模型通过将场景分解为对象来学习多个相互作用对象的复杂空间 - 时间动态,相较于基 - ICLRVAT-Mart: 学习 3D 关节物体操作的视觉动作轨迹提议
本文提出了一种基于物体的行动视觉先验的方法,即预测密集的几何感知、交互感知和任务感知的行动特征,结合强化学习策略和感知模块进行训练,通过探索多样的交互轨迹和总结概括所探索的知识来实现更好的感知 - 交互效果,并在大规模数据集上验证了其有效性 - 通过学习目标嵌入进行注意力,实现复杂的视觉推理
该文介绍了一种基于神经网络的动态视觉推理问题的更通用方法,通过学习物体中心表示、自我关注和自监督动力学学习,以实现三个不同领域的最先进表现,在每种情况下都优于针对任务特定定制的专用模块化方法。
- 利用物体中心的视觉可承受能力学习巧妙抓握
本研究介绍了一种在深度强化学习循环中嵌入面向对象视觉助力模型的方法,以学习优先选择与人类喜欢的对象区域相同的抓握策略,实现对物体的灵活抓握能力。通过 40 个物体的实验,表明该方法可以显著提高抓握策略效能,泛化能力较强,比普通基线方法的训练 - CaSPR: 学习规范时空点云表示
提出了一种名为 CaSPR 的方法,用于学习动态移动或演变对象的面向对象的规范时空点云表示,旨在使信息聚合在时间上,并在过去的任何时空邻域中查询对象状态,该方法通过将时间显式编码,将输入点云序列映射到时空标准化的对象空间来划分问题为两个子任