Jun, 2023

通过强化学习实现算法代理和 LLM 之间的高效交互

TL;DR本文主要介绍了使用基于强化学习的调解模型,来解决使用大型语言模型进行高级指令的效率和成本问题,并在四种实验环境下验证了该方法的准确性和效率。