BriefGPT.xyz
Ask
alpha
关键词
latent modeling
搜索结果 - 2
AudioToken:基于文本条件扩散模型的音频到图像生成适应性
本论文提出了一种新方法,利用文本 - 图像生成中训练的潜在扩散模型,生成基于音频记录的图像。该方法使用预训练的音频编码模型将音频编码成新令牌,这可以被视为音频和文本表示之间的自适应层。结果表明,相较于基准方法,该方法在客观和主观度量方面表现
→
PDF
a year ago
ICML
基于几何潜在扩散模型的三维分子生成
本研究提出了一种基于几何潜变扩散模型(GeoLDM)的新方法,通过在潜空间中运行扩散模型来生成分子的三维几何结构。该方法对生成大分子的有效百分比有 7%的提升。
PDF
a year ago
Prev
Next