BriefGPT.xyz
Ask
alpha
关键词
point cloud video
搜索结果 - 2
VG4D:视觉语言模型进入 4D 视频识别
通过 Vision-Language Models Goes 4D (VG4D) 框架,我们将 VLM 知识从视觉 - 文本预训练模型转移到 4D 点云网络中,实现了增强的识别性能。我们还提出了改进的 PSTNet 版本 im-PSTNet
→
PDF
3 months ago
DPMix: 4D 行动分割的混合深度和点云视频专家
通过将点云视频转换为深度视频并使用传统视频建模方法,提出的深度和点云视频专家混合(DPMix)方法显著提高了四维动作分割的准确性,并在 HOI4D Challenge 2023 的四维动作分割赛道中排名第一。
PDF
a year ago
Prev
Next