- 基于 Transformer 的多模式神经网络用于自动驾驶的运动预测
本文介绍了一种基于 Transformer 结构的神经预测框架来模拟车辆之间的社交关系和预测可能的轨迹,其中采用了多模态注意机制来解决运动预测的多模态问题,并在 Argoverse 运动预测数据集上得到了最佳预测精度。
- 异构轨迹预测的无限邻域交互
本研究提出了一种基于无限邻域交互网络的异构多类别交通态势预测方法,通过适应各种交互要素生成混合特征,并通过高层级图注意力模块实现类别间和代理间的交互,从而提高了预测性能。
- NIPS自动驾驶车辆的多模态轨迹预测:基于语义地图与动态图注意力网络
本文研究自动驾驶汽车预测未来路障轨迹的问题,提出了一种基于动态图注意力网络的方法,针对交通规则、社交互动、多类交通运动等方面的挑战,能够使用单一模型对多模态轨迹进行概率预测,并经过多个数据集的验证,证明该方法具有实际应用潜力且优于现有技术。
- SocialInteractionGAN: 多人互动序列生成
本文介绍了 SocialInteractionGAN—— 一种新颖的基于数据驱动的对抗性生成网络框架,其旨在以单模态展示的相互作用为重点,以离散多序列生成问题为基础,以建立在递归编码器 - 解码器生成网络和双流鉴别器之上的方法来处理相互作用 - 感知人类:从单目 3D 定位到社交距离
提出了一种成本效益高的基于视觉的方法,通过神经网络预测置信区间而非点估计来解决单眼 3D 任务中的挑战,从而能够有效识别交通系统中的人体姿态及其所在位置,并探讨了其在社交互动、安全等多个方面的应用。
- 自主驾驶车辆的运动预测
为了部署安全的自主驾驶汽车,需考虑静态几何上下文和动态社交交互,最近的深度学习方法已实现了距离预测指标的最新性能,但存在无法考虑 AV 意图运动计划的局限,因此提出了一种基于人 - 车道几何和人 - 人社交关系的图形加权循环递归方法,以支持 - 从深度学习角度对人群中的行人轨迹进行预测
本文研究基于深度学习和数据驱动方法来预测人类轨迹和建模社交交互的性能,同时提出了大规模基于交互的 TrajNet++ 基准,并在真实和合成数据集上进行了实验,验证了文中方法的可靠性。
- ECCV在视频中联合学习社交群体、个体动作和子群体活动
本文提出了一个端到端的可训练框架来解决人类活动理解中的社交任务。该框架同时分组人们,预测他们的个人行为和每个社交团体的社交活动,并提供了新的数据集注释。
- 多维主题空间中极化意识形态观点的出现
本文提出了一种基于多维空间,通过社会交互和共性原则的思想演化模型,解释了意见形成的意识形态现象,通过越来越具有争议性的主题,人们倾向于和相似观点的人互动,从而导致了意识形态的出现。
- ConvoKit:对话分析工具包
ConvoKit 是一款开源工具套件,提供了统一的数据结构和大量不同类型的对话数据集,降低了对话分析的技术门槛,促进了对话计算方法的广泛采用。
- 自然对话中连续情感识别的多模态传感器数据集 K-EmoCon
本文介绍了 K-EmoCon 数据集,该数据集支持从多个角度评估社交互动中的持续情感,并包括音频 / 视觉记录、EEG 和外围生理信号等多模态测量。
- EMNLP经验铸就语言
语言理解研究在未能将语言与其所描述的物理世界和所促进的社会互动相联系的情况下受到阻碍,因此现在的成功表示学习方法需要与涉及语言的更广泛的物理和社会背景的研究相结合来解决沟通的更深层次的问题。
- COVID-19 的接触率流行病控制:平衡视角
研究了通过标准 SIR 隔离模型控制 COVID-19 流行病的方法,通过降低社会交往行为来降低有效传播率,然而结果显示,每个人为了避免感染,限制自己的社交活动可能会导致社会收益的损失,存在着一定的混乱成本。
- 语言作为认知工具在好奇驱动的探索中想象目标
该研究论文旨在探讨发展性机器学习方法,通过模仿儿童利用语言描述目标实现创造性发现和开放式的学习过程中的能力,提出了一种叫做 IMAGINE 的深度强化学习框架,并研究了其泛化和探索能力,以及目标想象、模块化和社交互动等因素对其结果的影响。
- ICCV拥挤空间中基于社交及场景感知的轨迹预测
基于 LSTM 模型及人际交互、过往观测、周围空间语义等多重因素,预测人在城市场景中的运动方向的方法在测试中证明比传统 LSTM 模型准确,成为开发自动驾驶车辆与社交性机器人必不可少的一步。
- Social-BiGAT: 使用自行车生成对抗网络和图神经网络的多模态轨迹预测
本论文提出了 Social-BiGAT,一种基于图形的生成对抗网络,可通过更好地建模场景中行人之间的社交互动来生成逼真的多模态轨迹预测。与现有文献相比,我们通过图形注意力网络(GAT)学习可靠的特征表示来编码场景中人类之间的社会互动,以及逆 - CVPR多智能体张量融合用于上下文轨迹预测
自动驾驶中准确预测其他车辆 / 行人的运动轨迹非常重要,本文提出了一种基于多智能体张量融合网络的模型,可以模拟代理人之间的交互和约束以及环境场景等因素,从而实现对未来运动轨迹的精准预测,并在高速公路和行人数据集上表现出最先进的预测精度。
- AAAI一种解释本地图像区域社交交互的模型
本文研究利用小区域的可识别特征进行视觉上对社交互动的识别,并根据解释类的视觉分析方法,分析了由所提取的最小图像构成的社交互动物理素材的认知方法。
- EMNLP发问的修辞作用:政治话语中的发问是否太过苛求?
本文通过无监督的方法,提取并分类表现在社交互动中的问题的表面形式,揭示了这些问题中的修辞方面如何影响政治话语并揭示了议员任期和政治生涯抱负的效应。
- 从通话到社群:一种时变社交网络模型
提出了一种基于活动驱动的带记忆时间变化网络框架的时间网络模型,该模型整合了社会强化机制、焦点闭合和循环闭合等机制,可以生成具有社区结构和全局连通性的网络,且与真实的手机通信网络具有多种相似性。