Apr, 2024

Pegasus-v1 技术报告

TL;DRPegasus-1 是一种专注于通过自然语言实现对视频内容理解和交互的多模式语言模型,其设计旨在解决视频数据所带来的独特挑战,如解释时空信息,以提供对各种长度的视频内容的细致理解。