Oct, 2022

自回归神经序列模型的预测查询

TL;DR本文介绍了一个用于神经自回归序列模型中预测查询的通用分类方法,并展示了基于波束搜索,重要性抽样和混合方法的新查询估计方法,在四个大规模序列数据集(来自不同的应用领域)以及 GPT-2 语言模型中展示了在指数级预测路径空间中任意查询的查询回答能力,并发现在搜索和抽样方法之间的成本 - 精度权衡存在明显差异。