关键词multi-modal representation learning
搜索结果 - 7
- CMViM:用于 AD 分类的 3D 多模态表征学习的对比掩码 Vim 自编码器PDF3 months ago
- 通过观看数百个手术视频讲座学习多模态表示PDFa year ago
- 知识引导下的双重一致性模型用于多模态谣言检测PDFa year ago
- AAAI使用单塔 Transformer 统一视觉与语言表示空间PDF2 years ago
- 基于预训练模型 CLIP 的零样本外部分布检测PDF3 years ago
- ACL带序列匹配的并行关注网络用于视频 groundingPDF3 years ago
- AAAI多模态洗牌变换器的视频对话动态图表示学习PDF4 years ago
Prev
Next