关键词multi-modal framework
搜索结果 - 17
  • PNAS-MOT: 多模态物体跟踪的帕累托神经结构搜索
    PDF3 months ago
  • Path-GPTOmic: 一个平衡的多模态学习框架用于生存结局预测
    PDF4 months ago
  • MolTC: 语言模型中的分子关系建模
    PDF5 months ago
  • VoxelNextFusion:一个简单、统一且有效的多模态三维物体检测体素融合框架
    PDF6 months ago
  • CrysMMNet: 晶体属性预测的多模态表示
    PDFa year ago
  • Video-LLaMA: 一种面向视频理解的指令优化的音视频语言模型
    PDFa year ago
  • IJCAIFast-StrucTexT:一种具有模态引导动态令牌合并的高效沙漏变压器模型,用于文档理解
    PDFa year ago
  • AAAI定位再生成:通过边界框桥接视觉和语言进行场景文本 VQA
    PDFa year ago
  • 文本引导的蛋白质设计框架
    PDFa year ago
  • ACL有害模因中的实体特征:谁是英雄、反派和受害者?
    PDFa year ago
  • MM你会变得流行吗?学习预测舞蹈片段的病毒性
    PDF3 years ago
  • MM一幅画胜千言:用于生成多样化字幕和富有表现力图像的统一系统
    PDF3 years ago
  • 端到端多模式视频时间定位
    PDF3 years ago
  • ACLLayoutLMv2: 多模态预训练用于视觉丰富的文档理解
    PDF4 years ago
  • 多模态多通道目标语音分离
    PDF4 years ago
  • AAAIUrban2Vec:结合街景图像和兴趣点的多模态城市社区嵌入
    PDF4 years ago
  • CogniVal:一种认知词嵌入评估框架
    PDF5 years ago
Prev
Next