Jan, 2025

如何选择可重用的预训练代码模型?从学习的视角出发

TL;DR本研究解决了在众多公开发布的预训练代码模型中,选择最适合特定任务模型的难题。通过提出基于学习的模型选择策略,利用代理模型评估预训练模型的性能,并测量模型潜在特征与任务标签之间的分布偏差,显著提高了选择效率,将选择时间缩短至100秒,同时保持了性能损失在6%以内。此工作为代码智能任务提供了有效的模型选择指导。