Jul, 2024

基于梯度路由的硬注意力门控内窥镜图像计算

TL;DR为了解决过拟合问题、提高胃肠病变息肉尺寸评估模型的泛化能力,本研究引入了特征选择门(FSG)或硬注意力门(HAG),并结合梯度路由(GR)进行动态特征选择。该技术旨在通过促进稀疏连接来增强卷积神经网络(CNNs)和视觉变换器(ViTs),从而减少过拟合并增强泛化能力。经过多个数据集的评估,包括CIFAR-100数据集与针对病变息肉尺寸评估的真实结肠镜、Misawa和SUN数据集,共涵盖了超过370,000帧的200个病变息肉。研究结果表明,我们增强的网络在与胃肠病变息肉尺寸相关的二元和三元分类任务中极大地提升了性能。具体而言,CNN的二元分类F1得分提高至87.8%,而ViT-T模型的三元分类F1得分达到76.5%,超过了传统CNN和ViT-T模型。为了促进进一步的研究,我们发布了包括CNNs、多流CNNs、ViT和HAG增强变体在内的代码库。该资源旨在标准化胃肠病变息肉尺寸评估领域的研究,为可靠和可比较的研究提供了公开的训练、验证和测试数据集拆分。代码库可在github.com/cosmoimd/feature-selection-gates获取。