关键词multi-modal framework
搜索结果 - 17
- PNAS-MOT: 多模态物体跟踪的帕累托神经结构搜索PDF3 months ago
- Path-GPTOmic: 一个平衡的多模态学习框架用于生存结局预测PDF4 months ago
- MolTC: 语言模型中的分子关系建模PDF5 months ago
- VoxelNextFusion:一个简单、统一且有效的多模态三维物体检测体素融合框架PDF6 months ago
- CrysMMNet: 晶体属性预测的多模态表示PDFa year ago
- Video-LLaMA: 一种面向视频理解的指令优化的音视频语言模型PDFa year ago
- IJCAIFast-StrucTexT:一种具有模态引导动态令牌合并的高效沙漏变压器模型,用于文档理解PDFa year ago
- AAAI定位再生成:通过边界框桥接视觉和语言进行场景文本 VQAPDFa year ago
- 文本引导的蛋白质设计框架PDFa year ago
- ACL有害模因中的实体特征:谁是英雄、反派和受害者?PDFa year ago
- MM你会变得流行吗?学习预测舞蹈片段的病毒性PDF3 years ago
- MM一幅画胜千言:用于生成多样化字幕和富有表现力图像的统一系统PDF3 years ago
- 端到端多模式视频时间定位PDF3 years ago
- ACLLayoutLMv2: 多模态预训练用于视觉丰富的文档理解PDF4 years ago
- 多模态多通道目标语音分离PDF4 years ago
- AAAIUrban2Vec:结合街景图像和兴趣点的多模态城市社区嵌入PDF4 years ago
- CogniVal:一种认知词嵌入评估框架PDF5 years ago
Prev
Next