EMNLPOct, 2023

零射击物种识别中的科学名称提示

TL;DR使用视觉 - 语言模型 (CLIP) 进行零样本识别的研究,通过将科学名称翻译为常用的英文名称,作为提示语可以在精细物种识别数据集上取得 2 到 5 倍的准确率提高。