关键词multimodal model
搜索结果 - 45
  • 生成式视觉指导调整
    PDF15 days ago
  • 跨语言认知洞察:提升多模式面试分析
    PDF21 days ago
  • BTS:基于元数据辅助的呼吸音分类的文本和声音模态的桥接
    PDF22 days ago
  • 在多模态学习中利用视觉令牌扩展文本背景
    PDFa month ago
  • 解码抽象艺术中的情感:CLIP 在识别颜色 - 情感关联中的认知合理性
    PDF2 months ago
  • 来自语言模型的姿态先验
    PDF2 months ago
  • 自动驾驶场景中基于语言增强的潜在表示的异常检测
    PDF2 months ago
  • 引入路由功能以低秩瓶颈优化视觉语言参数高效微调
    PDF4 months ago
  • TextMonkey: 一个无需 OCR 的大型多模态模型用于理解文档
    PDF4 months ago
  • 基于大语言模型的通用实体链接
    PDF5 months ago
  • 利用大型多模式模型解释生成模型的潜在表示
    PDF5 months ago
  • 地理解码器:增强多模态地图理解
    PDF5 months ago
  • WebVoyager: 使用大型多模态模型构建端到端网络代理
    PDF5 months ago
  • 通向通用多模型的视觉指导调整:一项调查
    PDF6 months ago
  • 南非社交媒体环境中的多模态错误信息检测
    PDF7 months ago
  • 采用隐私合规特征进行野外多模态群体情绪识别
    PDF7 months ago
  • 构建大型多模态模型理解任意视觉提示
    PDF7 months ago
  • DocPedia: 在频域释放大型多模态模型的能力,实现多功能文档理解
    PDF7 months ago
  • 看得见才能相信:促进 GPT-4V 实现更好的视觉指导调优
    PDF8 months ago
  • ETDPC:电子学位论文页分类的多模态框架
    PDF8 months ago
Prev