Mar, 2024

使用Rollout算法生成n-Grams、Transformers、HMMs和Markov Chains的最可能序列生成

TL;DR本研究提出了一种基于$n$-gram结构的transformer模型,并探讨了根据概率计算高可能性词序列的方法,以及基于单一策略迭代的推演方法,实验结果显示这些方法可以在计算量上进行适度的增加,同时生成高可能性的词序列。