- DisC-GS:离散感知高斯点渲染
该论文介绍了高斯喷洒方法的基本限制以及一种新的框架,用于在图像渲染过程中准确地处理不连续性和边界,并引入了边界梯度逼近策略以保持其可微分性。通过大量实验验证了该框架的有效性。
- 端到端率失真优化的三维高斯表示
该研究提出了 RDO-Gaussian 方法,采用紧凑的 3D 高斯学习作为端到端速率失真优化问题,通过引入动态修剪和熵约束矢量量化来优化速率和失真,从而显著减小 3D 高斯体的大小超过 40 倍,并在速率失真性能上超越了现有方法。
- GaMeS:基于网格的高斯散射自适应和修改
最近几年,引入了一系列基于神经网络的图像渲染方法。其中,被广泛研究的神经辐射场(NeRF)依靠神经网络来表示三维场景,可以从少量的二维图像中合成逼真的视图。然而,大多数 NeRF 模型在训练和推理时间上都受到限制。相比之下,高斯喷洒(GS) - AnyLens:一种带有任意渲染镜头的生成扩散模型
本研究介绍了一种将文本到图像扩散模型与图像渲染中使用的特定镜头几何结合的框架,通过像素坐标条件方法实现对渲染几何的控制,并展示了使用单个扩散模型进行鱼眼、全景视图和球体纹理等多样化视觉效果的操控。
- 利用高程数据改进 NeRF 模型以利用 GIS 数据
本文提出一种基于高度数据的神经放射场方法用于重建大规模场景,将场景空间分为多个对象和背景,通过分别使用神经网络表示这些对象来改善渲染图像的精度和训练速度。
- DiffUTE: 通用文本编辑扩散模型
提出了一种通用的自监督文本编辑扩散模型(DiffUTE),基于扩散模型和网络结构的改进,结合字形和位置信息,利用大量的网络数据进行自监督学习训练,实现了在保持真实外观的同时替换或修改源图像中的单词,并且能够绘制多语言字符,同时具备出色的图像 - NeBLa:基于神经系统的 Beer-Lambert 法进行口腔结构在全景放射状图像中的三维重建
本文提出了一种新的框架,通过射线采样和渲染函数,将仿真的牙科摄影机图像转化为真实的口腔成像,利用相应的训练数据,生成口腔的三维结构,最终完成 CBCT 数据的重建,结果表明,与其他先进技术相比,该方法效果更佳。
- CVPR可渲染的神经辐射图用于视觉导航
本研究提出了一种新型的神经辐射图的可渲染地图,利用神经辐射场使得可以通过一个相机姿态进行图像渲染,并开发出可以有效利用这种神经辐射图进行定位和导航的框架。在各种测试中,我们证明了该框架的有效性和优于现有方法的普适性。
- BallGAN: 球形背景下的 3D 感知图像合成
提出一种名为 BallGAN 的 3D 感知 GAN 框架,通过近似背景为球面并将场景表示为背景内的前景和薄球形背景的并集的方法,减少背景领域中的自由度,以解决现有方法存在的 3D 几何不自然与训练不稳定的问题,从而实现更合理的 3D 几何 - DeepMovie:使用光流和深度神经网络实现电影风格化
该论文扩展了 Gatys 等人的方法,使用光流来保证样式特征与画面对象相对位置不变,进一步实现在给定艺术风格下渲染视频。
- 利用循环对抗网络生成图像
该篇论文提出一种基于卷积网络的像素优化方法,在此基础上将梯度下降转化为递归算法,并使用生成式对抗网络进行训练,生成高质量图像,并提出一种生成器与判别器间的量化比较方法。
- 卷积神经网络在检测方面存在哪些问题?
本研究旨在探究卷积神经网络中的设计选择与改进,通过对 R-CNN 检测器的新注释的经验分析,发现现有的最先进的卷积神经网络架构对于不同外观因素不具备不变性,并且不能仅通过增加训练数据来解决问题,需要进行架构变化。在数据增强方面,利用图像渲染