Jun, 2024

一见钟情:基于大型多模态模型的天文图像零样本分类

TL;DR使用自然语言提示,无需额外训练即可实现视觉-语言多模态模型对低表面亮度星系和艺术品的零样本分类以及星系形态分类,在自然语言提示下,这些模型通常能够实现显著的准确度(通常在 80%以上),我们讨论了一些需要改进的领域,特别是 LLaVA-NeXT,这是一个开源模型,我们的研究结果旨在激励天文学界将视觉-语言多模态模型视为研究和教育的强大工具,并希望未来定制或优化的模型能够表现更好。