BriefGPT.xyz
大模型
Ask
alpha
关键词
image-guided
搜索结果 - 3
ACL
多模态事件转换器用于图像引导的故事结尾生成
提出了一种基于多模态事件转换器的图像引导故事结尾生成方法,该方法利用事件图、跨模态融合和事件推理等技术从故事情节和结尾图像中推导隐含信息,并在解码器中适应性地注入必要信息,实验证明其在故事结尾生成方面性能优于现有方法。
PDF
a year ago
基于动态空间传播网络的深度填充
本文提出了一种名为 DySPN 的动态空间传播网络,通过注意力机制学习像素之间的关联性,以生成 RGB 图像的密集深度图,并采用扩散抑制技术防止过度平滑。实验结果表明,在 KITTI Depth Completion 和 NYU Depth
→
PDF
2 years ago
DeepHuman:从单张图像重建 3D 人体
提出了一种用于从单个 RGB 图像进行 3D 人体重建的基于图像引导的体积到体积的转换 CNN,通过 SMPL 模型生成密集的语义表示来减少与表面几何重建相关的歧义,将不同尺度的图像特征融合到三维空间中,并通过法线细化网络来进一步提高可见面
→
PDF
5 years ago
Prev
Next