BriefGPT.xyz
Ask
alpha
关键词
automatic reasoning
搜索结果 - 2
大型语言模型的自动多步推理和工具使用
ART 框架使用冻结的 LLM 自动生成中间推理步骤作为程序,并能无缝集成生成和外部工具使用,使得在 BigBench 和 MMLU 基准测试中,通过自动 CoT 和 few-shot 提示,ART 实现了对未知任务的实质性改进。在选定的任
→
PDF
a year ago
AAAI
关于强化学习中的困难探索:Pommerman 的案例研究
本研究研究了如何在具有稀疏、延迟和欺骗性回报的域中进行最佳探索,通过分析 Pommerman 的难度,提出了一种基于模型的自动推理模块,可以用于更安全的探索,通过实验证明了该模块可以显著提高学习效果。
PDF
5 years ago
Prev
Next