BriefGPT.xyz
Ask
alpha
关键词
action-state value functions
搜索结果 - 1
用信息解释来描述语言模型解码中的权衡特征
我们提出了一个理论框架,用于利用动态规划和信息论来构建语言模型解码器算法。通过动态规划,我们将解码器算法的设计从逻辑空间提升到动作 - 状态值函数空间,并展示解码算法是优化动作 - 状态值函数的结果。动作 - 状态值函数空间的每个组件都具有
→
PDF
8 months ago
Prev
Next