基于分布区分的个性化轨迹预测
在动态环境中,道路用户轨迹预测是一个具有挑战性但十分关键的任务,特别适用于自动驾驶等各种应用。本研究提出了一种新的框架,以计算高效的方式利用扩散模型来预测未来的轨迹。我们展示了该方法在常见的行人和自动驾驶基准数据集上取得了最先进的性能。
Oct, 2023
自动驾驶任务中,在复杂交通环境中进行轨迹预测需要遵循现实世界的环境条件和行为多模态。我们介绍了一种名为 Controllable Diffusion Trajectory (CDT) 的新型轨迹生成器,它将地图信息和社交交互融入到基于 Transformer 的条件去噪扩散模型中,以指导未来轨迹的预测。通过引入行为标记,如直行、向右转或向左转,确保轨迹呈现多模态,并且使用预测的终点作为替代行为标记,以促进准确轨迹的预测。在 Argoverse 2 基准测试中的大量实验表明,CDT 在复杂城市环境中生成多样且符合场景要求的轨迹。
Feb, 2024
本文提出了 MotionDiffuser 模型,其能够学习多个交通参与者之间联合分布的多模态表示,在实现高效计算精确样本概率的前提下,提出了一种压缩轨迹表示以提高模型性能,并结合约束抽样框架,以应用于强制束缚和创造定制化模拟场景等应用,最终在 Waymo 数据集上实现了最先进的多代理运动预测结果。
Jun, 2023
本文针对之前的距离度量学习算法中存在的一些问题,提出了一种通过分布模型在表示空间中自适应评估相似性,并通过惩罚类别分布重叠实现局部判别的新方法,在多项任务上取得了最新的分类结果,并提高了所学表示的属性集中度和层次恢复能力。
Nov, 2015
在这篇论文中,我们提出了 DiffDis,通过扩展扩散过程,将跨模态生成和辨别预训练统一到一个框架中。DiffDis 通过融合噪声文本嵌入和来自不同尺度的潜在图像的知识,提出了一种新颖的双流网络架构,来解决图像 - 文本辨别任务。通过基于扩散的统一训练,DiffDis 在一种体系结构中实现了更好的生成能力和跨模态语义对齐。实验结果表明,DiffDis 在图像生成和图像 - 文本辨别任务上优于单一任务模型,例如在 12 个数据集上的零样本分类的平均准确性提高了 1.65%,在零样本图像合成的 FID 上提高了 2.42 个点。
Aug, 2023
该研究提出了一种名为 MotionDiff 的扩散概率模型,将人体运动的运动学视为受热的粒子,其自原始状态扩散到噪声分布。该方法通过一种自然的方式获取了 “白化” 的潜在变量,而无需任何可训练参数,证明 MotionDiff 模型在两种数据集上具有竞争力的准确性和多样性表现。
Oct, 2022
基于记忆的 Motion Pattern Priors Memory Network 方法通过构建从训练集轨迹中观察到的运动模式的聚类先验知识构成的记忆库,并引入地址机制来检索匹配的模式和每个预测的潜在目标分布,从而使得在真实世界场景中的不确定性下,准确地预测人类行为轨迹成为可能。
Jan, 2024
研究发现现有的分布距离度量方法,例如 Frechetdistance 或 Maximum Mean Discrepancy,不能在分布偏移中可靠地估计模型性能;然而,分类器预测的置信度差异能够成功地估计分类器在各种转移情况下的性能变化,并且在几个现实和具有挑战性的分布转移中有效地减少预测误差近一半(46%),这一方法称为 DoC (Difference of Confidences)。
Jul, 2021
本研究提出了一种基于马尔科夫链和 Transformer 的运动不确定性扩散逆向建模框架,通过逐步放弃不可行走区域的不确定性直至到达期望轨迹,用于解决行人轨迹预测中的多模态问题,并取得了在 Stanford Drone 和 ETH/UCY 数据集上的优异表现。
Mar, 2022