Sep, 2024

关于用于侧扫声纳图像分类任务的视觉变换器

TL;DR本研究解决了侧扫声纳图像中人造物体分类的挑战,尤其是在复杂的海底环境中。通过比较视觉变换器(ViT)与传统卷积神经网络(CNN)架构,发现ViT模型在多个分类性能指标上表现更佳,尽管需要更大的计算资源。这一发现为未来在资源受限的水下环境中应用ViT提供了新的思路。