Aug, 2023

通过引导学习:内窥镜图像分类的知识蒸馏

TL;DR内窥镜在识别胃肠道的潜在异常方面起着重要作用。最近,深度学习,特别是卷积神经网络(CNNs),在胃肠道内窥镜图像分析方面报道了显著的优势。然而,现有的模型大多关注性能的提高,缺乏开发在资源有限环境中运行的轻量级模型的重点。我们通过三种基于知识蒸馏学习框架进行研究,并引入了一种新颖的基于多头注意力的特征融合机制来支持基于关系的学习。在两个广泛使用的公共数据集 KVASIR-V2 和 Hyper-KVASIR 上进行了广泛的评估,实验结果表明了我们提出的基于关系的框架在实现资源有限环境中运行的改进轻量级模型(仅有 51.8k 可训练参数)方面的优点。