Feb, 2024

政治科学中的语言模型:迎接视觉分析的新时代

TL;DR该研究旨在提高政治科学领域利用 Gemini 进行图像内容分析的可行性认识。通过对一个包含 688 幅图像的语料库进行回顾性分析,我们发现 Gemini 在执行物体检测方面非常准确,而物体检测是政治科学图像分析中最常见和基础的任务。同样重要的是,我们展示了 Gemini 的易用性,整个命令只需一个自然语言提示,运行速度快,能满足大多数研究者的时间预算,且免费使用,不需要任何专门的硬件。此外,我们还说明了政治科学家如何利用 Gemini 进行其他图像理解任务,包括人脸识别、情感分析和标题生成。研究结果表明,Gemini 和其他类似的大语言模型有潜力在政治科学和社会科学等领域大幅刺激和加速图像研究。