关键词visual clues
搜索结果 - 15
  • CVPR面部身份匿名化:通过内在和外在注意力扰动
    PDF9 days ago
  • 关于 GPT-4 在文档理解中的适用性注解
    PDFa month ago
  • COLING基于地标指导的跨说话人唇读技术与互信息规范化
    PDF3 months ago
  • 通过挖掘问答提示发现丰富的视觉线索,为需要多样化世界知识的 VQA 提供支持
    PDF5 months ago
  • GloPro: 全球一致的不确定性感知的野外三维人体姿势估计与跟踪
    PDF9 months ago
  • ACL一种基于多模态上下文推理的条件推断方法,适用于联合文本和视觉线索
    PDFa year ago
  • 视觉线索:跨越视觉和语言基础的 image 段落字幕生成
    PDF2 years ago
  • CVPR多样性很重要:充分利用深度线索实现可靠的单目三维物体检测
    PDF2 years ago
  • 福尔摩斯事件:一个用于视觉拟合推理的数据集
    PDF2 years ago
  • ECCV多模态文本识别网络:视觉和语义特征之间的交互增强
    PDF3 years ago
  • AAAI视频问答的时域金字塔变换器和多模态交互
    PDF3 years ago
  • ACL车内对话代理的乘客意图音视频理解
    PDF4 years ago
  • 基于单目相机的 ADAS 车间距与相对速度的端到端学习
    PDF4 years ago
  • AAAI融合音频、文本和视觉特征进行新闻视频情感分析
    PDF8 years ago
  • 用于图像问答的叠加注意力网络
    PDF9 years ago
Prev
Next