BriefGPT.xyz
Ask
alpha
关键词
process feedback
搜索结果 - 1
AMOR: 通过过程反馈构建适应性模块化知识代理的方法
基于开源语言模型的 AMOR 代理框架通过外部知识库进行推理,并通过人类监督适应于具体领域的推理过程,利用有限状态机构建推理逻辑以实现问题解决和模块之间的过渡,并通过两阶段微调加强其泛化能力和适应性。通过多个领域的广泛实验,证明了基于有限状
→
PDF
5 months ago
Prev
Next