Nov, 2023
GPT4Video:一种用于指令跟随理解和注重安全生成的统一多模态大型语言模型
GPT4Video: A Unified Multimodal Large Language Model for lnstruction-Followed Understanding and Safety-Aware Generation
Zhanyu Wang, Longyue Wang, Zhen Zhao, Minghao Wu, Chenyang Lyu...
TL;DRGPT4Video 是一个统一的多模型框架,将大型语言模型(LLMs)赋予了视频理解和生成的能力,通过集成基于指令遵循的方法和稳定扩散生成模型,GPT4Video 在视频理解和生成场景中表现出优异的能力,同时保持端到端的安全和健康对话。