关键词visual scene
搜索结果 - 14
- 视网膜视觉变换器 (RetinaViT): 将缩放图块引入视觉变换器PDF3 months ago
- KITE: 基于关键点条件的语义操作策略PDFa year ago
- CVPR混合声音源的本地化PDF2 years ago
- SAVi++:面向真实世界视频的端到端物体中心学习PDF2 years ago
- 一种基于 Rational Speech Act 框架的指称表达:概率方法PDF2 years ago
- ECCV图像和点云的语言基础的自底向上和自顶向下检测变压器PDF3 years ago
- AAAI从多个未指明的视点无监督学习构造场景表示PDF3 years ago
- 基于距离变换回归的空间感知深层语义分割PDF5 years ago
- 基于语言条件的图网络用于关系推理PDF5 years ago
- CVPR视频中的对象指称:基于语言和人类凝视PDF6 years ago
- ACL从视觉中学习基数和量词的含义:精确或模糊PDF7 years ago
- CVPR迭代消息传递的场景图生成PDF7 years ago
- phi-LSTM:一种面向短语的分层 LSTM 图像字幕生成模型PDF8 years ago
- 认知机器人的深度功能场景理解:周边区域我能做什么?PDF8 years ago
Prev
Next