Jan, 2025

视频深度任意物体:超长视频一致性深度估计

TL;DR本研究解决了单目深度估计在视频中存在的时间不一致性问题,限制了其实际应用。我们提出了“视频深度任意物体”模型,能够在超长视频中实现高质量和一致性的深度估计,且不牺牲效率。实验结果表明,该模型在多个视频基准上设置了零-shot视频深度估计的新状态-of-the-art,支持不同规模的应用场景。