关键词visual commonsense reasoning
搜索结果 - 13
- 视觉 - 语言 Transformer 是否具备视觉常识?对 VCR 的经验研究PDFa month ago
- EventLens: 利用事件感知预训练和跨模态链接提升视觉常识推理PDF2 months ago
- 通过空间关系建模改进视觉语言推理PDF8 months ago
- ViCor:用大型语言模型桥接视觉理解和常识推理PDF9 months ago
- EMNLP图像文本生成的进展 —— 以自我合理化为案例研究PDF2 years ago
- 利用单模编码器进行视觉语言任务的多模适应蒸馏PDF2 years ago
- 基于注意力机制的认知层场景理解PDF2 years ago
- AAAISGEITL: 基于场景图增强的图像 - 文本学习,用于视觉常识推理PDF3 years ago
- 使用动态工作记忆的认知视觉常识推理PDF3 years ago
- ECCVVisualCOMET:推理静态图像的动态上下文PDF4 years ago
- 异构图学习用于视觉常识推理PDF5 years ago
- 基于文本中检测物体的视觉问答融合PDF5 years ago
- CVPR从识别到认知:视觉常识推理PDF6 years ago
Prev
Next