BriefGPT.xyz
Ask
alpha
关键词
image modality
搜索结果 - 4
CVPR
多模态上下文学习的关键是什么?
通过对大型多模态模型的多模态 ICL 的研究,我们发现 M-ICL 主要依赖于文本驱动机制,几乎不受图像模态的影响。当与高级 ICL 策略(如 RICES)一起使用时,M-ICL 并不比基于大多数投票的上下文示例简单策略更好,此外,我们还发
→
PDF
2 months ago
ACL
MPCHAT: 面向多模态角色驱动的对话
本研究旨在通过引入图像模态转化多维人物角色的性格特点和经验,探究多模态人物角色在对话中的应用和作用,并通过多个任务的实验证明,多模态人物角色的引入可以显著提升多模态对话的性能表现。
PDF
a year ago
医学图像中的视觉变压器:综述
本文综述 Transformer 模型在医学图像处理中的应用,包括使用注意力机制编码 - 解码结构的 Transformer 模型与卷积神经网络的比较,基于 Transformer 模型的医学图像分类、分割、配准和重建方法,以及与 CNNs
→
PDF
2 years ago
MM
基于耦合字典学习的多模态图像处理
该论文提出了一种基于耦合字典学习的多模态图像处理框架,能够在所学的稀疏变换域中捕捉不同图像模态之间的相似性和差异性,并能够用于改善图像处理任务,如图像去噪。
PDF
6 years ago
Prev
Next