BriefGPT.xyz
大模型
Ask
alpha
关键词
visual masking
搜索结果 - 2
指令引导下的视觉遮罩化
通过引入指导型视觉遮罩(IVM)来改进多模式指令跟踪,本研究在多模式设置下证明了 IVM 的适用性,并显示出在图像与指令之间进行准确的视觉对齐的优势。通过构建视觉遮罩,IVM 增强的多模式模型能够更好地关注与任务相关的图像区域,从而取得更好
→
PDF
a month ago
使用自监督视觉遮盖增强图像质量预测
本文通过引入视觉遮盖的概念并在已有的 FR-IQM 模型上进行改进,提出了一种能够更准确地捕捉人类感知的新型图像质量评价方法。同时也提出了建立视觉遮盖模型的自监督学习方法,以此更好地预测图像质量。
PDF
a year ago
Prev
Next