Feb, 2024

基于动态多重奖励权重的多样式可控生成的强化学习

TL;DR通过强化学习方法控制多种风格的生成,使用动态权重方法优于静态权重方法,并在2个和3个风格控制方面进行了实证探索。