关键词visual scene
搜索结果 - 14
  • 视网膜视觉变换器 (RetinaViT): 将缩放图块引入视觉变换器
    PDF3 months ago
  • KITE: 基于关键点条件的语义操作策略
    PDFa year ago
  • CVPR混合声音源的本地化
    PDF2 years ago
  • SAVi++:面向真实世界视频的端到端物体中心学习
    PDF2 years ago
  • 一种基于 Rational Speech Act 框架的指称表达:概率方法
    PDF2 years ago
  • ECCV图像和点云的语言基础的自底向上和自顶向下检测变压器
    PDF3 years ago
  • AAAI从多个未指明的视点无监督学习构造场景表示
    PDF3 years ago
  • 基于距离变换回归的空间感知深层语义分割
    PDF5 years ago
  • 基于语言条件的图网络用于关系推理
    PDF5 years ago
  • CVPR视频中的对象指称:基于语言和人类凝视
    PDF6 years ago
  • ACL从视觉中学习基数和量词的含义:精确或模糊
    PDF7 years ago
  • CVPR迭代消息传递的场景图生成
    PDF7 years ago
  • phi-LSTM:一种面向短语的分层 LSTM 图像字幕生成模型
    PDF8 years ago
  • 认知机器人的深度功能场景理解:周边区域我能做什么?
    PDF8 years ago
Prev
Next