BriefGPT.xyz
大模型
Ask
alpha
关键词
gflops
搜索结果 - 2
形变变换器用于视觉跟踪的高效训练
DETRack 是一种高效的端到端视觉目标跟踪框架,利用编码器 - 解码器结构和可变形 Transformer 解码器作为目标头,显著减少了 GFLOPs 并通过新颖的一对多标签分配和辅助去噪技术加快了模型的收敛速度。实验证实了该方法的有效
→
PDF
10 months ago
ECCV
迭代视频 - 文本共同标记的视频问答
本文提出了一种新型的多流视频编码器,使用多个视频输入和新的视频文本迭代共同标记方法来回答与视频相关的各种问题,同时将所需的 GFLOPs 从 150-360 减少到只有 67,实现了高效的视频问答模型,并在 MSRVTT-QA,MSVD-Q
→
PDF
2 years ago
Prev
Next