关键词quantitative and qualitative evaluation
搜索结果 - 4
- 探索文本生成音乐中的个性化方法
调查了在 few-shot 设置中对文本到音乐扩散模型进行个性化的工作。首次探索了将预训练的文本到音频扩散器与两种常用的个性化方法结合的组合。实验了音频特定数据增强对系统整体性能的影响,并评估了不同的训练策略。构建了一个包含提示和音乐片段的 - 基于布局引导的图像生成的诊断基准和迭代修复
本文提出了 LayoutBench 和 IterInpaint 两个基于互补技术的图像布局与生成模型,旨在解决现有模型在处理任意或未见过的图像布局方面的不足,同时在四个空间控制技能方面进行定量和定性评估。
- ECCV基于深度范例的语义稀疏上色网络
本文提出了一种 Semantic-Sparse Colorization Network (SSCN) 方法,实现了基于模板的着色的正确对应,该方法在定量和定性评估方面优于现有方法。
- CVPR学习个别讲话风格以实现准确的唇读语音合成
本文提出了一种基于说话者唇部运动的语音合成方法,通过收集唇部运动大规模数据集并针对唇读单个说话者在自然环境下的情况进行模型设计,该模型可以更准确、自然地模拟说话者的语音,其量化、定性评估结果表明,该方法比现有方法的可理解性提高了四倍。