一种基于 Transformer 的胃肠道疾病检测方法

Oct, 2022

一种基于 Transformer 的胃肠道疾病检测方法

Gastrointestinal Disorder Detection with a Transformer Based Approach

A.K.M. Salman Hosain, Mynul islam, Md Humaion Kabir Mehedi, Irteza Enan Kabir, Zarin Tasnim Khan

TL;DR本研究使用视觉转换器和迁移学习模型对内窥镜图像进行特征分类，从而协助医疗诊断，识别肠道疾病，准确率可达 95.63％。与预训练的卷积神经网络模型 DenseNet201 进行比较，并证明视觉转换器在各种数量化性能评估指标上均优于 DenseNet201。

Abstract

Accurate disease categorization using endoscopic images is a significant problem in Gastroenterology. This paper describes a technique for assisting medical diagnosis procedures and identifying →

endoscopic images medical diagnosis gastrointestinal tract disorders vision transformer wce

发现论文，激发创造

UGCANet：一种统一的全局上下文感知基于 Transformer 的网络，具有特征对齐功能，用于内窥镜图像分析

本研究提出了一种多任务利用全局上下文感知模块和特征对齐块的 Transformer-based 深度神经网络，可用于精确识别上消化道病变和肠息肉，实验证明其性能卓越。

Jul, 2023

用于胸部 X 射线和胃肠道图像分类的视觉 Transformer

使用不同的卷积神经网络和 Transformer 方法以及广泛的数据增强技术，在三个医学图像数据集上比较了它们的表现，并将视觉 Transformer 模型与其他先进的预训练 CNN 网络进行了评估和比较，在分类不同的解剖结构、所见和异常方面，我们的 Transformer 模型优于或更有效，比 CNN 基于的方法有所改进，建议将其用作算法开发的新基准算法。

Apr, 2023

通过引导学习：内窥镜图像分类的知识蒸馏

内窥镜在识别胃肠道的潜在异常方面起着重要作用。最近，深度学习，特别是卷积神经网络（CNNs），在胃肠道内窥镜图像分析方面报道了显著的优势。然而，现有的模型大多关注性能的提高，缺乏开发在资源有限环境中运行的轻量级模型的重点。我们通过三种基于知识蒸馏学习框架进行研究，并引入了一种新颖的基于多头注意力的特征融合机制来支持基于关系的学习。在两个广泛使用的公共数据集 KVASIR-V2 和 Hyper-KVASIR 上进行了广泛的评估，实验结果表明了我们提出的基于关系的框架在实现资源有限环境中运行的改进轻量级模型（仅有 51.8k 可训练参数）方面的优点。

Aug, 2023

采用带类别感知损失的知识蒸馏进行内窥镜疾病检测

本文提出了一个利用深度学习来改善诊断失误率的框架，针对胃肠道癌症的诊断，利用端到端的师生学习方式，采用多类别学生网络来利用训练过的师范模型的类别概率，从而提高困难检测病变的定位并最小化漏检率，模型在两个数据集上都实现了更高的 mAP，并且具有泛化性。

Jul, 2022

通过结合 CNNs 的分类和 HMMs 的时间序列分析在胃肠道中进行精确定位

本研究提出了一种有效地对视频胶囊内镜图像进行肠胃分类的方法，该方法通过将卷积神经网络（CNN）用于分类与隐马尔可夫模型（HMM）的时间序列分析属性相结合，演示了连续的时间序列分析可以识别和纠正 CNN 输出的错误，该方法在罗得岛（RI）胃肠病学数据集上达到了 98.04％的准确率，适用于只需大约 1M 参数的低功耗设备，从而可以精确定位胃肠道。

Oct, 2023

GastroVision: 计算机辅助胃肠疾病检测的多类胃镜图像数据集

为了在临床实践中整合实时人工智能系统，需要解决数据可用性、数据质量和缺乏多样性数据集等挑战。为此，我们介绍了 GastroVision，一个多中心开放获取的胃肠内镜数据集，该数据集包括来自胃肠道的 24 种不同病理异常、息肉切除病例和正常发现，提供了大规模、精确标记的多样化数据集，并验证了数据集的重要性。我们相信，该数据集可以促进基于人工智能的胃肠疾病检测和分类算法的开发。

Jul, 2023

改进的 EATFormer：用于医学图像分类的视觉 Transformer

本文提出了一种基于进化算法的改进型 Transformer 架构，用于医学图像分类。该架构在 Convolutional Neural Networks 和 Vision Transformers 的基础上结合了它们的优势，利用它们在数据中识别模式和适应特定特征的能力。实验结果表明，与基准模型相比，所提出的 EATFormer 显著改善了预测速度和准确性。

Mar, 2024

基于聚类引发的掩模变换器对非对比 CT 扫描进行有效的机遇性胃癌筛查

使用非对比度 CT 扫描结合深度学习方法进行胃癌筛查，通过独特的集群感应掩膜变换技术实现肿瘤分割和异常分类，与传统方法相比具有更高的敏感性和准确性，是一种新型的、非侵入性、低成本且准确的机会性胃癌筛查方法。

Jul, 2023

MEDVQA-GI 2023 中 UIST-Saviors: 基于图像增强的胃肠道可视化问题回答的多模态学习改进

结合计算机视觉和自然语言处理，提出了一种多模态学习方法来改善胃肠道图像上的视觉问答性能，通过 BERT 编码器和基于卷积神经网络（CNN）和 Transformer 架构的不同预训练视觉模型从问题和内窥镜图像中提取特征，结果显示 Transformer-based 视觉模型在 CNN 上具有优势，并展示了图像增强过程的有效性。

Jul, 2023

利用基于视觉的 Transformer 模型从心电图像中检测心脏疾病

使用先进的视觉转换模型从心电图图像中检测心脏疾病，并与现有研究进行比较，结果显示该框架具有显著的分类结果。

Oct, 2023