BriefGPT.xyz
Ask
alpha
关键词
clip's text encoder
搜索结果 - 1
利用 LMM 激发的情感嵌入进行干扰图像检测
本研究通过利用大型多模型模型中编码的知识,提出了一种新的方法来解决干扰图像检测的任务。该方法通过提取通用语义描述和引发的情感来利用多模型模型中的知识,并利用 CLIP 的文本编码器获取文本嵌入。最后,将这些文本嵌入与相应的 CLIP 图像嵌
→
PDF
18 days ago
Prev
Next