关键词textual cues
搜索结果 - 7
- CVPRDocSynthv2:面向文档生成的实用自回归建模PDF24 days ago
- COLING多模态跨文档事件共指消解的线性语义转移和混合模态集成PDF3 months ago
- SyCoCa: 对称化的关注屏蔽对齐的对比式字幕生成器PDF6 months ago
- 舞动的阿凡达:基于姿势和文本引导的人体动作视频合成与图像扩散模型PDFa year ago
- 用于开放式语义分割的多模态原型PDFa year ago
- CVPR利用胶囊网络进行弱监督的视觉问答PDF3 years ago
- CVPR利用场景文本理解广告PDF6 years ago
Prev
Next