关键词caption generation
搜索结果 - 26
  • CVPRMICap: 一个统一的身份感知电影描述模型
    PDF2 months ago
  • CVPR利用 MLLM 的能力进行可迁移的文本到图像人物再识别
    PDF2 months ago
  • ACLBCAmirs 参与 SemEval-2024 第 4 项任务:超越言语:以多模态和多语言方式探索 Memes 中的说服力
    PDF3 months ago
  • 基于神经模型的图像标题增强
    PDF7 months ago
  • 高效图像探索与用户引导图像标题生成的视觉分析
    PDF8 months ago
  • ICCV自我监督的跨视图表示重建用于变化字幕
    PDF9 months ago
  • Vote2Cap-DETR++:解耦定位与描述的端到端三维稠密字幕
    PDF10 months ago
  • 以图注形式生成科学文档的自动文本摘要
    PDFa year ago
  • EMNLP沟通失效:人类和神经字幕之间的低互通性
    PDF2 years ago
  • 利用外部百科知识生成图像描述
    PDF2 years ago
  • CVPR使用外部知识检索词汇的新颖目标字幕生成技术 NOC-REK
    PDF2 years ago
  • CVPRZeroCap:面向视觉语义算术的零样本图像到文本生成
    PDF3 years ago
  • EMNLPSciCap:生成科学图像的标题
    PDF3 years ago
  • ACLO2NA:一种用于可控视频字幕生成的面向对象非自回归方法
    PDF3 years ago
  • MM使用自然语言查询搜索未经处理的视频数据库
    PDF4 years ago
  • CVPR实体感知新闻图像标题生成
    PDF4 years ago
  • EMNLP图像字幕中的组合泛化
    PDF5 years ago
  • 通过对抗式学习生成多样且准确的视觉描述
    PDF6 years ago
  • CVPR通过重构过去与现在生成字幕的正则化循环神经网络
    PDF6 years ago
  • 连续视频流中的事件检测和描述
    PDF6 years ago
Prev