Mar, 2024

LEGION: 利用预训练语言模型进行 GitHub 主题推荐的分布平衡损失

TL;DR开源开发背书了软件行业,“Legion” 是一个使用预训练语言模型为 GitHub 仓库推荐主题的新方法,通过利用 PTM 的广泛能力来捕捉 GitHub 仓库的上下文信息和语义含义,通过提出分布平衡损失来解决 PTM 中偏向热门主题的挑战,并通过过滤器消除模糊的建议,从而改进了 PTM 的精度。在实际基准数据集上的实证评估表明,“Legion” 在推荐 GitHub 主题方面比原始 PTM 提高了 26%,在精确度和 F1 得分方面平均提高了 20% 和 5%。