BriefGPT.xyz
Ask
alpha
关键词
java source code
搜索结果 - 4
使用训练 / 测试去重的 Java 方法语言模型
本文提出了一种用于 Java 源代码的语言模型研究工具包,包括开放可搜索的训练集、含有不同程度去重的测试集、去重新示例的基础设施以及适用于相对较小预算的设备执行的实现平台,并使用类似于 GPT2 的架构和巨大的训练集进行训练。
PDF
a year ago
JaCoText:用于 Java 代码文本生成的预训练模型
本文介绍了一种基于 Transformer 神经网络的模型 JaCoText,旨在将自然语言文本生成 java 源代码。通过在强大的预训练模型上初始化,探索我们的 java 数据集上的额外预训练,以及在训练中结合单模态和双模态数据的实验,以
→
PDF
a year ago
ICLR
非参数语言模型中的结构局部性获取
本文探讨了利用结构局部性在非参数语言模型中的应用,并提出了一种简单而有效的方法来将学习参数加入到这些模型中以提高局部邻域中检索示例的概率,并在 Java 源代码和维基百科文本等不同领域进行了实验,发现结构局部性特征可以改善模型效果。
PDF
3 years ago
AAAI
将自然语言注释与源代码实体关联
本研究提出了一种使用开源项目的修订历史自动提取有监督数据并为此任务提供手动注释评估数据集的方法,通过构建丰富的特征集,包括代码、注释及其之间的关系,开发了二元分类器和序列标记模型,从而实现 Java 代码中 Javadoc 注释实体与代码元
→
PDF
5 years ago
Prev
Next