Jun, 2024
GPT-4o:多模大型语言模型在仔猪活动理解中的视觉感知表现
GPT-4o: Visual perception performance of multimodal large language models in piglet activity understanding
Yiqi Wu, Xiaodan Hu, Ziming Fu, Siling Zhou, Jiangong Li
TL;DR动物行为识别研究评估了多模态大型语言模型在畜牧场景视频理解中的视觉感知能力,并验证了其在动物活动识别方面的潜力以及对未来动物行为视频理解研究提供了新的方向和参考。