关键词spatiotemporal context
搜索结果 - 3
- 提升家庭环境安全与福祉的综合多模态数据集
本研究提供了一个合成的多模态数据集,通过融合来自 3D 虚拟空间模拟器的视频数据与描绘活动时空上下文的知识图谱,该数据集旨在用于社会问题的知识图谱推理挑战(KGRC4SI),重点是识别和解决家庭环境中的危险情况,该数据集对于研究人员和从业者 - CVPR深度双连续网络用于人体姿态估计
本文提出了一种基于多帧和时序信息的人体姿态估计方法。该方法包含三个模块:姿态时序合成器、姿态残差融合模块和姿态校正网络。在 PoseTrack2017 和 PoseTrack2018 数据集上进行的实验结果表明,该方法取得了最佳效果,并已发 - ICCVVATEX:一个大规模、高质量、多语种的视频与语言研究数据集
我们提出了一个新的大规模多语言视频描述数据集 VATEX, 其中包含超过 41,250 个视频和 825,000 条英文和中文字幕,拥有超过 206,000 个英中平行翻译对。我们还基于 VATEX 引入了两项视频与语言研究任务:(1)多语