Jun, 2023
InterCode:标准化和基准测试带有执行反馈的交互式编码
InterCode: Standardizing and Benchmarking Interactive Coding with Execution Feedback
John Yang, Akshara Prabhakar, Karthik Narasimhan, Shunyu Yao
TL;DR本研究提出 InterCode 框架,作为交互式编码的标准强化学习(RL)环境,并使用 Bash 和 SQL 作为行动空间,以前沿的 LLMs 和其它编码策略作为实证对象,以展示其优越性和可持续性,同时证明其作为推进代码理解和生成能力的有挑战性的基准测试。