AAAINov, 2023

使用大型语言模型评估编程策略的可解释性

TL;DR使用大语言模型来评估编程策略的可解释性,并验证其在解决编程问题和实时策略游戏中的应用,结果表明该度量标准在评估编程策略的可解释性方面是可靠且廉价的工具。