HEAL-ViT：用球形网格实现中程天气预报的视觉 Transformer

Feb, 2024

HEAL-ViT：用球形网格实现中程天气预报的视觉 Transformer

HEAL-ViT: Vision Transformers on a spherical mesh for medium-range weather forecasting

Vivek Ramavajjala

TL;DRHEAL-ViT 是一种新颖的架构，它在球面网格上使用 ViT 模型，从而同时享受基于图的模型的空间均匀性和变压器所利用的高效注意力机制，能够产生优于 ECMWF IFS 的天气预报结果。

Abstract

In recent years, a variety of ml architectures and techniques have seen success in producing skillful medium range weather forecasts. In particular, →

ml architectures vision transformer rectilinear grid spherical mesh weather forecasts

发现论文，激发创造

HEAL-SWIN: 球面上的视觉 Transformer

本研究提出了一种结合 HEALPix 网格和 SWIN transformer 的模型，名为 HEAL-SWIN transformer，可以在高分辨率、无失真的球面数据上进行训练，用于语义分割和深度回归任务，且性能更优。

Jul, 2023

SRViT：基于视觉 Transformer 的规模化卫星观测雷达回波反射率估计

我们引入了一种基于 Transformer 的神经网络，从地球同步卫星影像生成高分辨率（3km）的合成雷达反射率场，旨在提高高影响天气事件的短期对流尺度预报能力，并在美国数值天气预报的数据同化中提供帮助。与卷积方法相比，我们的结果显示出对各种复合反射率阈值的改善锐度和更高准确性。通过额外的特定大气现象案例研究支持我们的定量研究结果，同时引入了一种新颖的归因方法来指导领域专家理解模型的输出。

Jun, 2024

GeoViT：一种用于地理空间影像分析的多功能视觉 Transformer 架构

GeoViT 是一种紧凑的视觉转换模型，熟练处理卫星图像以进行多模式分割、分类和回归任务，目标是 CO2 和 NO2 排放。利用 GeoViT，我们在估计发电率、燃料类型、CO2 的尾气覆盖率和高分辨率 NO2 浓度地图方面获得了卓越的准确性，超过了先前的最先进模型，同时显著减小了模型尺寸。GeoViT 表明了视觉转换器架构在利用卫星数据提升温室气体排放见解方面的功效，对全球气候变化监测和排放规章制度的推进具有关键作用。

Nov, 2023

使用可视 Transformer 解决 3D 图像 Weather4cast 挑战

本文介绍了通过使用基于 transformer 的算法来解决 NeurIPS 2022 中的 Weather4cast 挑战，预测在接下来的 8 小时内的降雨事件，并通过将不同的 transformer 和基线模型进行集合，获得了最好的性能。

Dec, 2022

医学图像分割的视觉 Transformer 近期综述

医学图像分割是各种医疗应用中至关重要的一环，能够实现准确的诊断、治疗规划和疾病监测。最近，视觉变换器（ViTs）作为一种有望解决医学图像分割挑战的技术逐渐崭露头角。本综述论文对于医学图像分割中 ViTs 和混合视觉变换器（HVTs）的最新发展进行了详细的回顾。除了对 ViT 和 HVT 的分类外，还详细介绍了它们在几种医学图像模态中的实时应用。这篇综述可以作为研究人员、医疗从业者和学生了解 ViT 基于医学图像分割的最新方法的有价值的资源。

Dec, 2023

HSViT：水平可扩展的视觉 Transformer

这篇论文介绍了一种新型的水平可伸缩视觉转换器 (HSViT)，通过引入新的图像级特征嵌入和设计创新的水平可伸缩架构，以减少模型的层数和参数数量，并促进 ViT 模型在多个节点上的协同训练和推理，从而实现比现有方案高多达 10% 的 top-1 准确率，证明了其在保持归纳偏差方面的优越性。

Apr, 2024

CaFA：基于球面上的因式化注意力的全球天气预报

我们提出了一种适用于球面几何的因子化注意力模型，用于天气预测。该模型在精确度和效率上的表现与纯数据驱动的机器学习天气预测模型相当，具备在准确度与计算成本上优于基于 Transformer 模型的标准注意力模型的潜力。

May, 2024

EL-VIT: 使用交互可视化研究视觉 Transformer

EL-VIT 是一种交互式可视化分析系统，可以帮助 ViT 用户理解 ViT 的工作机制，通过四个层次的可视化视图展示 ViT 的模型架构、操作过程和数学运算，以及计算图块之间的余弦相似度。

Jan, 2024

Vision Transformers：一种用于高分辨率和大规模覆盖树冠高度的新方法

本文使用新的视觉 Transformer 模型在加纳的广泛景观上进行优化，同时优化分类（离散）和回归（连续）损失函数，从而实现了比以前使用的卷积方法更高的准确度。模型的结果表明，我们提出的离散 / 连续损失显着提高了对非常高的树（即 > 35m）的灵敏度，而对于其他方法，往往会出现饱和效应。最终，ViT 模型的高度图具有更好的地面采样距离和更好的稀疏植被灵敏度，与卷积模型相比，其 RMSE 仅为 3.12m。

Apr, 2023

RangeViT：用于自动驾驶 3D 语义分割的视觉 Transformer

本文应用 Vision Transformers 和卷积解码器改进了基于投影的 3D 语义分割方法以获得更好的结果，并在 nuScenes 和 SemanticKITTI 数据集上超过了现有的投影方法。

Jan, 2023