BriefGPT.xyz
大模型
Ask
alpha
关键词
spatial-temporal relationships
搜索结果 - 4
FLD: 傅里叶潜在动力学用于结构化动作表示和学习
我们介绍了一种自监督的结构化表示和生成方法,能够提取周期性或准周期性运动中的时空关系,通过在连续参数化的潜在空间中进行运动动力学,增强了运动学习算法的插值和泛化能力,为未来的运动表示和学习算法的发展开辟了新的可能性。
PDF
4 months ago
利用更好的架构、优化和数据建立开放式词汇视频 CLIP 模型
本研究介绍了 Open-VCLIP++,它是一个简单而有效的框架,通过最小化修改 CLIP 来捕捉视频中的时空关系,从而创建一个专门的视频分类器,同时追求泛化性。通过在训练和测试过程中利用权重插值的优势,我们演示了训练 Open-VCLIP
→
PDF
9 months ago
DynamicBEV: 利用动态查询和时间上下文进行三维物体检测
动态 BEV(Bird's Eye View)是一种新的查询方法,利用动态查询和动态场景下的聚类以及注意力机制,有效地从局部和远距离特征中聚合信息,实现对复杂场景的迭代适应,进而提高三维物体检测的效率和性能,从而在查询式 BEV 物体检测领
→
PDF
9 months ago
利用潜在状态推断和时空关系实现自主驾驶的强化学习
本文介绍了利用深度强化学习和图神经网络,结合编码潜在状态和空间 - 时间关系的方法解决自动驾驶场景下规避横穿车辆的难点,实现了显著性能提升。
PDF
4 years ago
Prev
Next