Feb, 2024

AMOR: 通过过程反馈构建适应性模块化知识代理的方法

TL;DR基于开源语言模型的 AMOR 代理框架通过外部知识库进行推理,并通过人类监督适应于具体领域的推理过程,利用有限状态机构建推理逻辑以实现问题解决和模块之间的过渡,并通过两阶段微调加强其泛化能力和适应性。通过多个领域的广泛实验,证明了基于有限状态机推理和过程反馈机制的 AMOR 相对于强基线的优势。