关键词captioning
搜索结果 - 24
  • Shotluck Holmes:用于视频字幕和摘要的高效小规模大语言视觉模型家族
    PDFa month ago
  • CVPRMICap: 一个统一的身份感知电影描述模型
    PDFa month ago
  • CVPROmniVid: 通用视频理解的生成框架
    PDF3 months ago
  • 通过提示实现任意分词
    PDF7 months ago
  • VLM-Eval: 视频大型语言模型的通用评估
    PDF7 months ago
  • 视频 CSR: 复杂视频摘要生成用于视觉 - 语言模型
    PDF9 months ago
  • UniBrain:将图像重建与字幕生成统一于一个扩散模型之中从人脑活动
    PDFa year ago
  • ICCVOxfordTVG-HIC: 机器能否从图像中制作幽默的标题?
    PDFa year ago
  • 使用 GPT 嵌入式技术揭示 FMRI 脑语言
    PDFa year ago
  • AAAISciCap+: 研究科学图标题挑战的知识增强数据集
    PDFa year ago
  • 基于大型语言模型的图像背景和描述生成字幕
    PDFa year ago
  • ACL使用语言模型反馈的零样本视觉问答
    PDFa year ago
  • 通过生成扩散指导的视角分析多模式目标
    PDFa year ago
  • CVPR用于通用事件边界字幕生成的双流 Transformer
    PDF2 years ago
  • 多模态视频字幕生成的端到端生成预训练
    PDF2 years ago
  • EMNLPR$^3$Net: 基于关系嵌入的表示重建网络用于变化描述
    PDF3 years ago
  • ICCV通过视觉概念进行任务感知的集成学习和迁移学习,赢得 ICCV'2021 VALUE 挑战
    PDF3 years ago
  • 图像字幕和视觉问答自动解析网络
    PDF3 years ago
  • ACL基于伪可视中心词的无监督多模态神经机器翻译
    PDF4 years ago
  • EMNLPVideo2Commonsense: 生成通识描述以丰富视频字幕
    PDF4 years ago
Prev