Sep, 2022

REST:生成式动作识别的检索与自训练

TL;DR本文提出使用 REST 框架,在不使用任何动作特定标签的情况下,通过生成的方式将生成模型适应于影片 / 动作,并使用基于 CLIP 的检索方法来训练模型,旨在实现训练一个生成模型,生成一个动画特定的自由格式标题来描述图像 / 动画识别,以解决细粒度识别难以在传统的目录式方法中表示的问题,并取得了不错的成效。