Feb, 2024

诱导模型匹配:限制型模型如何帮助更大的模型

TL;DR考虑使用限制特征的非常准确的预测模型在训练更大的全功能模型时的情景,通过将全功能模型的限制上下文性能与限制模型的上下文性能进行对齐,我们提出了一种将限制模型的知识转移到全功能模型的方法,称为引导模型匹配(IMM),并通过逻辑回归和语言建模等应用实例阐述了它的通用适用性和显式基础。我们还使用 n-grams 作为限制模型,在 LSTM 和 transformer 全功能模型上演示了该方法的原理,并通过简单的强化学习示例进一步说明当收集限制信息比收集完整信息廉价得多时,该方法的潜力。