May, 2023

使用训练 / 测试去重的 Java 方法语言模型

TL;DR本文提出了一种用于 Java 源代码的语言模型研究工具包,包括开放可搜索的训练集、含有不同程度去重的测试集、去重新示例的基础设施以及适用于相对较小预算的设备执行的实现平台,并使用类似于 GPT2 的架构和巨大的训练集进行训练。