Jan, 2024

CrisisViT:一种适用于危机图像分类的稳健视觉Transformer

TL;DR利用最新的深度神经模型,通过将基于Transformer的架构应用于危机图像分类(CrisisViT),以解决利用社交媒体的公民新闻来帮助危机响应的问题,并通过实验证明,CrisisViT模型在紧急类型、图像相关性、人道主义类别和损害严重性分类方面明显优于以前的方法。此外,新的Incidents1M数据集进一步增强了CrisisViT模型,使其准确率提高了1.25%。