Jul, 2023

源代码语言模型共享与能源利用的探索文献研究

TL;DR本研究旨在调查与分析语言模型设计用于软件工程任务的研究是否共享代码及模型,以及针对模型训练所用的能源的透明度,从可持续的角度收集有用的信息。我们发现,当前研究中存在信息和工件共享的不足,约 40%的调查论文没有共享代码或训练过的工件,我们建议共享源代码和训练过的工件,以实现可持续的可重复性,同时还应该共享有关训练所需时间和硬件配置的全面信息,以确保模型的碳足迹透明度。