关键词visual
搜索结果 - 15
  • COLING多模态跨文档事件共指消解的线性语义转移和混合模态集成
    PDF3 months ago
  • 多模态视觉触觉表示学习通过自监督对比预训练
    PDF5 months ago
  • 理解路径规划解释
    PDF8 months ago
  • ICCVMISAR:一种具备增强现实的多模态指导系统
    PDF9 months ago
  • 人形机器人的感知
    PDF9 months ago
  • 厘清 “半满还是半空” 的问题:多模态容器分类
    PDFa year ago
  • Video-LLaMA: 一种面向视频理解的指令优化的音视频语言模型
    PDFa year ago
  • MM音视频显著性预测的双域对抗学习
    PDF2 years ago
  • 深度强化学习和 Real2Sim 策略适应在机器人视觉插入中的应用
    PDF2 years ago
  • 读者如何整合图表与说明:以线性图为例的研究
    PDF3 years ago
  • 自监督多模态通用网络
    PDF4 years ago
  • ACL生活方式视频中可见行为的识别
    PDF5 years ago
  • 学习音乐和图像之间的情感对应关系
    PDF5 years ago
  • LRS3-TED: 用于视觉语音识别的大规模数据集
    PDF6 years ago
  • 基于时间残差建模的卷积视频隐写术
    PDF6 years ago
Prev
Next