Jun, 2024

原型 Transformer 作为统一运动学习器

TL;DR通过 Prototypical Transformer(ProtoFormer)框架,本研究从原型视角途径多种动作任务。ProtoFormer 通过深思熟虑地考虑动作动态性引入了原型学习与 Transformer 的完美结合。交叉注意力原型化通过基于典型动作模式发现原型,提供了对动作场景的透明理解。同时,潜在同步通过原型引导特征表示学习,有效缓解了动作不确定性问题。实证结果表明,该方法在光流、场景深度等流行的动作任务上取得了有竞争力的性能。此外,它还在物体跟踪和视频稳定等多种应用任务中展现了广泛适用性。