- 使用足球转播视频中估计的姿势进行犯规预测
我们的研究引入了一种创新的深度学习方法,用于预测足球犯规。该方法通过构建一个新颖的足球犯规数据集,将视频数据、边界框位置、图像细节和姿势信息相结合,利用卷积和循环神经网络 (CNNs 和 RNNs) 从这四个模态中有效地融合信息。实验结果表 - 通过嵌入情景记忆的 NDT 实现车辆行为预测
通过 Episodic Memory implanted Neural Decision Tree (eMem-NDT) 来解释目标车辆的行为预测,模型具有清晰的可解释性、优异的性能和适用于实际使用的特点。
- 可解释运动预测的解缠关系神经推理
本文提出了一种变分自动编码器框架,通过整合基于图表示和时间序列模型,有效捕捉交互式动态代理之间的时空关系并预测其动态行为,进而增强模型的可解释性和在分布外泛化的能力。经过大量的仿真和现实世界数据集的实验证明,与现有方法相比,本方法在建模时空 - ALMANACS: 一种用于语言模型解释可解释性的可模拟性基准测试
我们通过使用 ALMANACS 来评估反事实、合理化、注意力和集成梯度解释等方法,发现没有一种解释方法在所有主题上超过无解释控制的模型,因此在 ALMANACS 中开发一种能够辅助模型可模拟性的解释方法仍然是一个挑战。
- 基于运动场景解耦的鼠类感知视频位置预测策略与基准测试
本研究提出了 RatPose 数据集,该数据集考虑了个体和环境的影响因素,并提出了一种名为双流场景运动解耦(DMSD)的方法来提高运动预测的鲁棒性,该方法在不同难度的任务中展示了显著的性能提升,同时验证了数据集的泛化能力。
- RESET: 重访轨迹集以进行条件行为预测
本文提出了一种基于集合的轨迹预测方法,将其应用于无人驾驶车辆的条件行为预测,并通过图形编码器和计划轨迹的后期融合,实现了与回归方法相当的性能。
- 虎鲸是否具有语义语言能力?利用部分标记语音数据进行机器学习预测虎鲸行为
通过机器学习分析 McMurdo 海峡虎鲸的声音记录,有 96.4% 的准确率预测出海豚的行为,这表明虎鲸通过语音进行语义交流,并为行为预测和安全应用提供了希望。
- 驾驶场景中的行为意向预测:一项综述
Behavioral Intention Prediction 技术在预测未来行为方面具有重要应用价值,本文探讨了 BIP-conditioned prediction 任务中各个方面的差异,并提出了未来研究方向。
- ProspectNet:基于加权的条件式注意力机制的交互未来预测建模
本文提出了 ProspectNet 作为一种新的机制,通过采用加权注意分数来建模交互代理对之间的相互影响和联合行为识别来解决自主驾驶软件解决方案中的行为预测问题。实验结果表明 ProspectNet 性能优于两个边缘预测的 Cartesia - 融合异构用户行为和社交影响的预测分析
此研究旨在将异构的用户行为与社会影响结合起来进行行为预测,并使用包括 LSTM 变体、多面向关系建模机制、多面向关注机制、社会行为图的无监督学习及基于残差学习生成高阶交叉特征的方法进行探讨,定量和定性实验表明该模型的有效性。
- 基于场景的自动驾驶行为预测模型测试平台
本文介绍了一种基于仿真的测试平台,支持用名为 Scenic 的概率编程语言进行情景建模,指定具有部分优先级排序的多目标评估指标,验证所提供的指标,以及进行可伸缩的测试。该平台包含 25 个 Scenic 程序库,并测试了行为预测模型并寻找失 - ICLRScene Transformer: 预测多个 Agent 轨迹的统一体结构
本篇研究旨在提出一种基于遮罩策略和注意力机制的场景中多智能体行为预测模型,以解决自动驾驶中的动态环境下多种智能体之间相互作用问题,结果表明该模型在多种运动预测任务上表现出优越性和普适性。
- 通过条件行为预测来识别司机交互
研究了自主驾驶车辆在交互场景下,如车道变换、合并和无保护的拐弯等车辆行驶行为预测问题,提出了一种基于轨迹建模和条件行为预测的交互得分方案,用于训练和评估行为预测模型的有效性评估。
- EMNLP通过自我监督从未标注的用户行为中预训练用户模型的 PTUM
本文提出了一种基于自监督学习的用户模型预训练方法,包括屏蔽行为预测和 $K$ 步预测两个任务,通过对大规模未标注用户行为数据进行预训练,并在下游任务中微调,获得了更好的效果。
- CVPRVectorNet:从矢量化表示编码高清地图和代理动态
本文介绍了一种新型的层级图神经网络 VectorNet,用于解决在自动驾驶汽车的动态多智能体系统中的行为预测问题,并通过在高精度建模的地图和智能体轨迹上的操作,使得该方法在两个行为预测基准测试中均达到优秀的性能。
- 交互感知概率预测的情境可迁移语义图推理
本文提出了一个基于语义知识的预测框架,通过将驾驶场景建模为时空语义图,并推理这些图之间的内部关系,实现对自动驾驶汽车的行为预测。框架不仅实现了最先进的性能,而且具有良好的零样本迁移性。
- WWW超越点击:建模多关系项目图用于基于会话的目标行为预测
本研究提出了一种基于多关系图神经网络模型的会话目标行为预测方法,通过建立一个多关系项图(MRIG),学习目标和辅助行为之间的全局递进关系,从而适应性地融合用户表示以预测下一个与目标行为交互的项目。该方法在两个真实数据集上进行的广泛实验表明, - 使机器人能够交流它们的目标
通过机器模拟对人类推导目标功能的学习过程,选择对人最具信息量的行为,以准确预测机器人在新情境下的行为,为此我们提出了两种候选的近似推断模型,并在自动驾驶领域中进行用户研究,结果表明,某些近似推断模型可以使机器人生成更好的行为示例,从而更好地