BriefGPT.xyz
大模型
Ask
alpha
关键词
high-quality synthesis
搜索结果 - 3
DiffAR: 去噪扩散自回归模型用于原始语音波形生成
本文提出了一种基于扩散的概率端到端模型,用于生成原始语音波形,该模型通过自回归的方式顺序生成重叠帧,可以实现无限语音时长的合成,并保持高保真度和时间连贯性,通过直接处理波形具有优势,可以创建局部声学行为,同时该模型是随机的,生成略有差异的波
→
PDF
9 months ago
跨注意控制的提示到提示图像编辑
该文提出了一种基于文本的图像编辑框架,利用交叉注意力层控制图像布局和文本之间的关系,实现了在不改变原始内容情况下的全局和局部编辑,从而达到高质量的图像合成。
PDF
2 years ago
神经演员:具有姿态控制的人体演员神经自由视角合成
提出了一种名为 Neural Actor 的新方法,可从任意视角和任意可控姿势中合成高质量的人类形象,其基于最近的神经场景表示和渲染作品,利用粗体模型将周围的三维空间映射为规范姿势,并从多视角视频输入中学习姿态依赖的几何变形和姿态和视觉依赖
→
PDF
3 years ago
Prev
Next