关键词visual content
搜索结果 - 36
  • 利用视频中的音频和视觉内容进行相机模型识别
    PDF9 days ago
  • LLavaGuard: 基于 VLM 的视觉数据集整理与安全评估保护
    PDFa month ago
  • 影响用户使用 SORA 的因素
    PDF2 months ago
  • 多模态大型语言模型的幻觉:一项调查
    PDF2 months ago
  • 大型视觉语言模型的评估是否正确?
    PDF3 months ago
  • Q-Align: 使用离散文本定义的级别教导 LMMs 进行视觉评分
    PDF6 months ago
  • 基于 StyleGAN 先验的可扩展人脸图像编码:朝向人机协作视觉压缩
    PDF6 months ago
  • InfoVisDial: 大型多模态和语言模型的信息可视对话数据集
    PDF6 months ago
  • 深度神经网络和双向动态时间扭曲算法的半监督三维视频信息检索
    PDF10 months ago
  • 可持续透明度在推荐系统中的应用:基于贝叶斯排序的图片解释能力
    PDFa year ago
  • 基于前缀调整的双门控融合技术用于多模态关系抽取
    PDFa year ago
  • ACL多样式图像字幕的样式感知对比学习
    PDFa year ago
  • EMNLPLexi: UI 语言的自监督学习
    PDFa year ago
  • 生成式人工智能对视觉内容营销未来的影响
    PDF2 years ago
  • AAAI探索 CLIP 用于评估图像外观和感觉
    PDF2 years ago
  • ECCVVizWiz-FewShot: 视觉障碍人士拍摄的图像中物体定位
    PDF2 years ago
  • 生成模型作为多视角表示学习的数据源
    PDF3 years ago
  • CVPRDeFLOCNet: 灵活低层控制的深度图像编辑
    PDF3 years ago
  • CVPR场景图生成的语义歧义概率建模
    PDF3 years ago
  • QuerYD:一个具有高质量文本和音频叙述的视频数据集
    PDF4 years ago
Prev