Nov, 2023

GPT4Video:一种用于指令跟随理解和注重安全生成的统一多模态大型语言模型

TL;DRGPT4Video 是一个统一的多模型框架,将大型语言模型(LLMs)赋予了视频理解和生成的能力,通过集成基于指令遵循的方法和稳定扩散生成模型,GPT4Video 在视频理解和生成场景中表现出优异的能力,同时保持端到端的安全和健康对话。