关键词multimodal model
搜索结果 - 45
- 生成式视觉指导调整PDF15 days ago
- 跨语言认知洞察:提升多模式面试分析PDF21 days ago
- BTS:基于元数据辅助的呼吸音分类的文本和声音模态的桥接PDF22 days ago
- 在多模态学习中利用视觉令牌扩展文本背景PDFa month ago
- 解码抽象艺术中的情感:CLIP 在识别颜色 - 情感关联中的认知合理性PDF2 months ago
- 来自语言模型的姿态先验PDF2 months ago
- 自动驾驶场景中基于语言增强的潜在表示的异常检测PDF2 months ago
- 引入路由功能以低秩瓶颈优化视觉语言参数高效微调PDF4 months ago
- TextMonkey: 一个无需 OCR 的大型多模态模型用于理解文档PDF4 months ago
- 基于大语言模型的通用实体链接PDF5 months ago
- 利用大型多模式模型解释生成模型的潜在表示PDF5 months ago
- 地理解码器:增强多模态地图理解PDF5 months ago
- WebVoyager: 使用大型多模态模型构建端到端网络代理PDF5 months ago
- 通向通用多模型的视觉指导调整:一项调查PDF6 months ago
- 南非社交媒体环境中的多模态错误信息检测PDF7 months ago
- 采用隐私合规特征进行野外多模态群体情绪识别PDF7 months ago
- 构建大型多模态模型理解任意视觉提示PDF7 months ago
- DocPedia: 在频域释放大型多模态模型的能力,实现多功能文档理解PDF7 months ago
- 看得见才能相信:促进 GPT-4V 实现更好的视觉指导调优PDF8 months ago
- ETDPC:电子学位论文页分类的多模态框架PDF8 months ago
Prev