BriefGPT.xyz
Ask
alpha
关键词
video-based approach
搜索结果 - 3
基于视频的 VLM 为视觉与语言导航规划下一步
NaVid 是一个基于视频的大型视觉语言模型,通过动态的视频流输入,无需地图、测距仪和深度信息,实现了最先进水平的导航性能,解决了里程计噪声和模拟环境到真实环境之间的缺陷,同时有效地利用机器人的历史观察作为决策和指令遵循的时空背景,通过对
→
PDF
4 months ago
可穿戴传感器与视频数据捕捉用于人体运动分类的研究
本文比较了基于惯性测量单元 (IMU) 和基于视频的方法在军事按压和划船运动的人体运动分类中的表现,发现单个摄像头能比单个 IMU 提高 10 个百分点的分类准确率,而至少需要 3 个 IMU 才能超越单个摄像头。同时,使用基于多变量时间序
→
PDF
a year ago
基于时间注意力机制的视频行人属性识别方法
本研究提出了一种基于视频的多任务模型与时间注意策略相结合的新网络结构,解决行人属性识别方面的挑战。同时,本文还公开发布了两个新的大规模视频数据集,用于展示该方法的有效性。
PDF
5 years ago
Prev
Next