关键词visual context
搜索结果 - 41
  • 视觉上下文感知的人体跌倒检测
    PDF3 months ago
  • COLINGm3P: 走向多模多语翻译与多模提示
    PDF3 months ago
  • 基于视觉语言模型的字幕评估方法及其视觉上下文提取
    PDF4 months ago
  • 减少幻觉:利用视觉语境增强洪水灾害损害评估的 VQA
    PDF6 months ago
  • 上下文扩散:上下文感知图像生成
    PDF7 months ago
  • 视觉背景对噪声多模态神经机器翻译的影响:英语到印度语言的实证研究
    PDF10 months ago
  • ICCV探索人物 - 物体交互中的谓词视觉环境
    PDFa year ago
  • 文本驱动的少样本领域自适应视觉融合事件检测
    PDFa year ago
  • 语言引导的具身化智能体多模式语音识别
    PDFa year ago
  • ACL大规模跨语言研究:视觉限制对语言选择描述的影响
    PDFa year ago
  • EMNLP视觉语境能否提高具有体现特征的智能体自动语音识别的性能?
    PDF2 years ago
  • 用于字到句的视觉语义相似度在标题生成的应用:得到的经验教训
    PDF2 years ago
  • 基于视觉感知的音频特征增强,用于稳健的端对端音视频语音识别
    PDF2 years ago
  • SwapMix: 检测和规范视觉问答中过度依赖视觉上下文
    PDF2 years ago
  • 具有视觉上下文注意力的唇语到语音合成生成对抗网络
    PDF2 years ago
  • ACLMSCTD: 一种多模态情感聊天翻译数据集
    PDF2 years ago
  • ICCV视觉场景图用于音频源分离
    PDF3 years ago
  • EMNLP多模式机器翻译模型的合理性检查:关注视觉确保准确性
    PDF3 years ago
  • 多模态对话生成中的文本视觉相互依赖建模
    PDF3 years ago
  • EMNLP视觉线索和错误修正用于提高翻译稳健性
    PDF3 years ago
Prev