BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal encoders
搜索结果 - 4
缓解差距:研究提升 CLIP 中跨模态对齐的方法
通过设计 AlignCLIP,本文回答了共享多模态编码器参数空间是否减少模态间隙以及通过内部模态分离是否可以缓解间隙的两个主要问题,并通过大量实验证明了 AlignCLIP 在嵌入的跨模态对齐上取得了显著的改进,从而减少了模态间隙,并在零样
→
PDF
9 days ago
Tool-LMM:一个用于工具智能学习的大型多模态模型
通过使用多模态编码器将开源大语言模型(LLM)与多模态输入指令结合起来,我们提出了 Tool-LMM 系统,使学习的 LLMs 能够意识到多模态输入指令并正确选择匹配功能的工具,实验证明我们的 LMM 能够为多模态指令推荐适当的工具。
PDF
5 months ago
GeRA:标签高效的几何正则化对齐
引入半监督几何规范化对齐方法(GeRA)来对齐预训练单模态编码器的嵌入空间,通过利用不配对(无标签)数据的流形几何来改善对齐性能,引入了基于扩散算子的几何损失项来防止对局部几何的扭曲,GeRA 是模态不可知的,可以用于对来自任何数据模态的预
→
PDF
9 months ago
Ceci n'est pas une pomme: 多模态嵌入中的对抗幻觉
多模态编码器、敌对幻觉、嵌入空间、接近度、零样本分类。
PDF
10 months ago
Prev
Next