Apr, 2024

闭环学习中生成模型的热力学死亡

TL;DR通过研究喂给自己生成的内容以及原始训练数据集的生成模型的学习动态,本文旨在提供对 “生成闭环学习” 这一过程的洞察,揭示了没有足够外部数据时,任何非平凡的温度都会导致模型渐近退化,即生成分布要么坍缩为一小组输出,要么在一大组输出上变得均匀。