Feb, 2022

PRIMA: 多任务推理智能体内的规划推理器

TL;DR本研究提出了一个计划推理框架并采用深度强化学习的方式进行训练,旨在解决多任务推理中公共的难题,即如何保持广泛的推理能力和高效的特定任务表现。通过共享推理规则和选择合适的推理路径,该模型在多个领域的实验中取得了良好的效果。