- 稳定材料:通过半监督学习增强材料生成的多样性
使用 Semi-supervised learning 和 Latent Diffusion Models(LDMs)的 StableMaterials 方法,通过对抗训练从现有大规模图像生成模型中提取知识,生成与 SDXL 模型的图像纹理 - CVPR随地聆听
通过 DiffRIR 的不同 iable RIR 渲染框架,使用场景的参数化模型,合成具有各种声音特征的新的听觉体验。
- 全局基于参数化的纹理空间优化
基于全局参数化,本文提出了一种优化纹理空间以及生成紧凑纹理映射的方法,该方法在计算上具有鲁棒性和高效性,并实验证明了该方法的有效性以及在存储和渲染效率方面的潜力。
- 三维人物化身建模综述 -- 从重建到生成
3D 建模近年来得到了快速发展,特别是在三维人体建模方面,这篇综述从重建和生成的角度全面介绍了相关技术和方法,并对现有方法的反思和未来研究方向进行了讨论。
- 建模和渲染散射和发光介质的体素基元
基于基元的体积表示可以用于建模散射和发光介质,并具有相对高效的渲染。我们提出了基于混合核心体积基元的散射和发光介质建模方法,并提供了一些优化以实现高性能和易用性。
- 使用扩散模型进行受形状限制的人体动作生成
我们提出了一种基于形状条件的运动扩散模型(SMD),该模型可以直接在网格格式中生成运动序列,并结合了频谱 - 时间自编码器(STAE)以在频谱域内利用跨时依赖关系。通过广泛的实验评估,我们证明了 SMD 不仅可以生成栩栩如生的真实动作,而且 - 一般非刚性场景三维重建的最新趋势
重建现实世界的模型,包括三维几何、外观和场景的运动,是计算机图形学和计算机视觉的核心问题。该研究汇总了最新的技术,并讨论了非刚性场景的三维重建、场景分解和编辑、通用建模等内容,同时探讨了其中的限制和挑战。
- 多模态条件下的三维感知图像生成和编辑
本文提出了一种新颖的端到端 3D 感知图像生成和编辑模型,通过纯噪声、文本和参考图像等多种条件输入,在 3D 生成对抗网络(GANs)的潜在空间中深入研究并提出解缠特性较好的生成策略,同时采用统一框架进行灵活的图像生成和编辑任务,实现多模态 - 新视觉时代中的 3D 高斯:综述
3D 高斯散射(3D-GS)是计算机图形学领域的重要进展,提供了明确的场景表示和新颖的视图合成技术,而无需依赖神经网络(如神经辐射场(NeRF))。本文对 3D 高斯散射的相关论文进行了全面调研,将调查结果按照特征和应用进行分类,介绍了 3 - 医学领域 AI 增强虚拟现实技术综述
该论文通过引入系统分类法,对 AI 增强的虚拟现实应用于医疗保健领域进行了全面调查,将相关技术和应用细分为三个类别,即可视化增强、与 VR 相关的医学数据处理和 VR 辅助干预,为对这些技术进行更全面的理解和评估提供了一个框架。据我们所知, - 三维生成的进展:综述
生成 3D 模型是计算机图形学的核心,并且已经成为几十年研究的重点。随着先进的神经表示和生成模型的出现,3D 内容生成领域正在快速发展,使得越来越高品质和多样化的 3D 模型得以创建。本文调查了 3D 生成方法的基本方法,并建立了一个结构化 - 3D 高斯点云渲染调查
3D 高斯喷洒是一种能够实时渲染的、可控且可编辑的 3D 重建和表示方法,通过显式场景表示和可微分的渲染算法,提供了独特的优势,为下一代 3D 重建和表示技术带来了潜在的变革。本文首次系统综述了 3D 高斯喷洒的最新进展和重要贡献,包括其背 - 神经渲染及其硬件加速:综述
神经渲染是一种基于深度学习的新型图像和视频生成方法,将深度学习模型与计算机图形学的物理知识相结合,以获得可控和逼真的场景模型,并实现对光照、相机参数、姿态等场景属性的控制。本文回顾了神经渲染的技术内涵、主要挑战和研究进展,在此基础上分析了神 - 基于视频的渲染技术综述
图像中记录事件的三维重建长期以来一直是计算机视觉和计算机图形之间的共同挑战。本文介绍了视频渲染和基于图像的技术在此场景中的应用情况,评估了尚待解决的问题以及未来研究的重点。
- 具有隐式神经表示的空间自适应服装回归
本研究介绍了一种利用隐式神经表征的新型各向异性布料回归技术,其中包括创新的无网格抽样方法和新颖的对抗训练方案,以更好地捕捉细节布料纹理并保持计算效率。实验结果表明,在相同内存限制下,本方法在建模高度细节化的布料皱纹时始终超过传统的离散表示。
- 超越像素:探索视觉语言模型生成简单图像的人类可读 SVG
通过引入我们的方法(Simple-SVG-Generation,简称 S extsuperscript {2} VG extsuperscript {2}),我们专注于生成准确且简单的 SVG 图像,与人类的可读性和理解力相一致,通过与先进 - Soulstyler:基于大型语言模型引导图像风格转换的目标对象
通过简单的文本描述,我们提出了 “Soulstyler” 框架,让用户可以引导对特定物体进行图像风格化处理。我们介绍了一个大型语言模型来解析文本,识别风格化的目标和具体风格,并结合基于 CLIP 的语义视觉嵌入编码器,使模型能够理解并匹配文 - 视觉计算扩散模型的最新进展
视觉计算领域因生成人工智能的出现而快速发展,介绍了扩散模型的基本数学概念、稳定扩散模型的实现细节和设计选择,以及包括个性化、条件设定、反转等在内的这些生成人工智能工具的重要方面的综述。此外,它还对基于扩散的生成和编辑的迅速增长的文献进行了全 - 人脸图像的神经隐式变形
我们提出利用基于坐标的神经网络来表示面部图像的变形和融合。通过结合经典方法中的能量函数,我们利用这些网络的平滑性和灵活性进行训练,同时允许连续的面部变形和融合。实验结果表明,我们的方法在面部变形检测方法方面与传统方法和基于数据的神经技术相竞 - MatFuse: 控制能力的扩散模型材料生成
MatFuse 是一种基于扩散模型的新型统一方法,用于简化计算机图形学中高质量逼真材料的创建,通过集成多种条件来源实现细粒度控制和材料合成的灵活性,该方法展示出与最先进方法相当的性能,同时丰富了创作可能性。