关键词vision-language
搜索结果 - 49
  • 语言引导的多任务机器人操作的对比模仿学习
    PDF15 days ago
  • 双图强化 CLIP 用于零样本异常检测
    PDF2 months ago
  • 评估大型视觉语言模型时,我们究竟在衡量什么?潜在因素和偏见的分析
    PDF3 months ago
  • CVPRAIDE:用于自动驾驶中目标检测的自动数据引擎
    PDF3 months ago
  • 几乎零成本的安全微调:视觉大型语言模型的基准
    PDF5 months ago
  • 多模态基础模型的小样本自适应:综述
    PDF6 months ago
  • AAAICOMMA: 共同表达多模式学习
    PDF6 months ago
  • 基于多模态视觉语言的人类病理学基础人工智能助手
    PDF7 months ago
  • 基于视觉语言变换器的新兴定位特性
    PDF7 months ago
  • 视觉语言模型的领域泛化鲁棒微调
    PDF8 months ago
  • Kosmos-G: 使用多模态大型语言模型生成上下文中的图像
    PDF9 months ago
  • InternLM-XComposer:面向高级文本图像理解与构图的视觉语言大模型
    PDF9 months ago
  • LLaSM:大型语言和语音模型
    PDF10 months ago
  • 图像 - 文本检索的多模态数据集精炼
    PDF10 months ago
  • MM超越第一印象:整合多模态联合线索用于全面的 3D 表示
    PDFa year ago
  • ICCVSINC:自我监督上下文学习用于视觉 - 语言任务
    PDFa year ago
  • 通过语言模型预测手掌动作 @ Ego4D 长期行为预测挑战赛 2023
    PDFa year ago
  • RS5M:一种用于遥感视觉语言的大规模数据集和基础模型
    PDFa year ago
  • COSA: 连接样本预训练的视觉 - 语言基础模型
    PDFa year ago
  • 医学视觉语言理解和生成的多模型预训练:新基准的实证研究
    PDFa year ago
Prev