BriefGPT.xyz
Ask
alpha
关键词
auto-regressive generation process
搜索结果 - 1
Q*: 改进 LLMs 的多步推理与计划
通过引入 Q* 框架,我们可以缓解大型语言模型在多步推理时产生的错误、幻觉和不一致陈述的问题。Q* 是一个通用、多功能和灵活的框架,通过学习一个插拔式的 Q-value 模型作为启发式函数,有效地指导大型语言模型选择最有前途的下一步,避免了
→
PDF
21 days ago
Prev
Next