Apr, 2024

神经代码补全模型是否使用了我的代码?一种成员推断方法

TL;DR我们研究了当前神经代码完成模型的法律和道德问题,通过使用会员推理方法来确定给定代码样本的成员身份。实验证明 LSTM 和 CodeGPT 模型存在会员泄露问题,而 CodeGen 和 StarCoder 模型的数据成员资格很难检测,有待进一步改进。