May, 2023

LoViT:用于外科阶段识别的长视频Transformer

TL;DR本文介绍了一种称为长视频变压器(LoViT)的两阶段方法,用于融合短期和长期时间信息的融合,可以比当前的方法更好地处理手术过程中的长视频,并通过将本地和全局特征结合起来使用多尺度时间聚合器对手术相位进行分类。研究发现,与现有的方法相比,LoViT在两个手术视频数据集上的表现最优