BriefGPT.xyz
大模型
Ask
alpha
关键词
visual model
搜索结果 - 6
神经语义表面地图
我们提出了一种自动化技术,用于计算两个零层面的形状之间的映射,将语义对应的区域互相匹配。我们的方法通过多个视点渲染一对 3D 形状,然后将生成的渲染输入到一个现成的图像匹配方法中,以利用预训练的视觉模型生成特征点。这产生了语义对应,可以投射
→
PDF
10 months ago
LANCE: 通过生成语言引导的对抗性图像进行视觉模型的压力测试
提出一种用于自动化模型应力测试的算法 —— 生成基于语言引导的反事实测试图像(LANCE)。利用大型语言模型和基于文本的图像编辑的最新进展,我们可以增加 IID 测试集的多样性和挑战性,而不会改变模型权重。我们基于生成的数据对一系列不同的预
→
PDF
a year ago
探索提高视觉上下文学习效果的因素
该论文提出了一个简单框架 prompt-SelF,以增强视觉上下文学习的推理性能。通过实验证明 prompt selection 和 prompt fusion 是影响视觉上下文学习性能的主要因素之一。在单物体分割和检测任务上,prompt
→
PDF
a year ago
ECCV
重新思考图像去雨:基于雨线和雾气的方法
本文提出了一种基于编码 - 解码卷积神经网络的单图像去雨方法,通过将雨纹视为传输介质结合雾气模拟出遮盖效应,同时将编码器 CNN 用来估计大气光。实验表明,该方法相对于现有方法在效果上有优势。
PDF
4 years ago
用学习的语义模型改善从图像中提取信息
本研究回顾了视觉模型和统计语义先验模型相结合对图像与场景描述匹配的任务的改进,并将其与一种新颖的无明确训练视觉先验模型的条件多路模型进行比较。同时,我们还讨论了提出方法与人脑记忆模型之间的潜在关系。
PDF
6 years ago
KDD
神经模仿实现的电影融合
本研究提出了一种基于跨模态数据检索,利用深度学习模型,将书籍的内容通过其对应电影视觉呈现出来,研究并比较了使用对话、视觉和混合模型匹配书和电影内容的有效性。
PDF
7 years ago
Prev
Next