关键词video-text multi-modal understanding abilities
搜索结果 - 1
  • HawkEye: 训练以视频为基础的文本语言模型
    PDF4 months ago
Prev
Next