Nov, 2023

用信息解释来描述语言模型解码中的权衡特征

TL;DR我们提出了一个理论框架,用于利用动态规划和信息论来构建语言模型解码器算法。通过动态规划,我们将解码器算法的设计从逻辑空间提升到动作 - 状态值函数空间,并展示解码算法是优化动作 - 状态值函数的结果。动作 - 状态值函数空间的每个组件都具有信息论解释。通过提升和解释,变得明显解码器算法的优化目标是什么,因此有助于在合理性、多样性和权衡中进行调节。