Jun, 2024

嵌入式表示应该嵌入什么?自回归模型表示潜在的生成分布

TL;DR通过将自回归预测目标与构建预测充分统计量的思想联系起来,我们确定了三种情况下嵌入的最佳内容:独立同分布数据、潜在状态模型和离散假设空间,并进行实证研究表明 Transformers 编码了这三种潜在生成分布,并在这些情况下表现良好。