关键词vision
搜索结果 - 62
  • 用 Mamba 在视觉中进行自回归预训练
    PDF21 days ago
  • 多模态元学习中使用条件批量归一化的辅助任务调节的限制
    PDFa month ago
  • CVPR触觉增强辐射场
    PDF2 months ago
  • CVPR基于语言嵌入特征场的物性理解
    PDF3 months ago
  • Zero123-6D:RGB 类别级别 6D 姿态估计的零样本新视角合成
    PDF3 months ago
  • 然后锤子断裂:从女性主义科学哲学对机器伦理的思考
    PDF4 months ago
  • 基于 You Look Only Once (YOLO) 算法的农业目标检测:一项文献计量和系统文献综述
    PDF5 months ago
  • 灵长类动物大脑在视觉中如何结合生成和判别计算?
    PDF6 months ago
  • 视觉中可信大规模模型:调查
    PDF8 months ago
  • LLaVA-Plus: 学习使用创建多模态代理的工具
    PDF8 months ago
  • EvalCrafter: 大规模视频生成模型的基准测试和评估
    PDF8 months ago
  • 不考虑实例的几何和接触动力学学习
    PDF10 months ago
  • ICCVMosaiQ: 量子生成对抗网络在 NISQ 计算机上的图像生成
    PDF10 months ago
  • 面向移动应用的轻量级 SAM:更快的分割任何物体
    PDFa year ago
  • 揭示视觉问答中交叉模态偏见:基于可能世界的因果视角 VQA 分析
    PDFa year ago
  • VALOR: 视听语言全感知预训练模型和数据集
    PDFa year ago
  • 视觉是否加速神经语言学习者的分层泛化?
    PDFa year ago
  • 构建通用的语言、视觉和视觉语言理解任务的基础模型
    PDFa year ago
  • 超越三元组:利用最多数据进行多模态机器翻译
    PDF2 years ago
  • MM盲人高级音频辅助设备
    PDF2 years ago
Prev