Jul, 2023

学习针对息肉重新识别的判别性视觉文本表示

TL;DR在结直肠镜息肉再识别中,传统方法侧重于视觉表示学习,而忽略了在训练期间探索语义特征的潜力,这可能导致在新场景中使用预训练模型时存在较差的泛化能力。为了缓解这一困境,我们提出了一种名为VT-ReID的简单而有效的训练方法,可以通过高层语义信息的交换显著丰富息肉视频的表示。此外,我们精心设计了一种新颖的聚类机制,通过对比学习引入文本数据的先验知识,以促进与丰富的无标签文本数据更好的分离。据我们所知,这是首次尝试在结直肠镜息肉再识别中使用视觉文本特征和聚类机制。实证结果表明,我们的方法明显优于当前最先进的方法。