Jun, 2023

InterCode:标准化和基准测试带有执行反馈的交互式编码

TL;DR本研究提出 InterCode 框架,作为交互式编码的标准强化学习(RL)环境,并使用 Bash 和 SQL 作为行动空间,以前沿的 LLMs 和其它编码策略作为实证对象,以展示其优越性和可持续性,同时证明其作为推进代码理解和生成能力的有挑战性的基准测试。