Dec, 2023

CodeLL:支持数据和代码语言模型共同演进的终身学习数据集

TL;DR本研究介绍了 CodeLL,这是一个用于代码更改的生命周期学习数据集,能够全面覆盖开源软件库的发布历史中的代码更改,同时可用于研究生命周期微调设置下 LMs 行为、软件库中数据分布的变化以及 API 用法随时间的演变。