Oct, 2023
LLM 性能预测模型为架构搜索提供良好初始值
LLM Performance Predictors are good initializers for Architecture Search
Ganesh Jawahar, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Dujian Ding
TL;DR使用大型语言模型构建性能预测模型,并在机器翻译和神经架构搜索领域展示出优越的性能,同时提出基于大型语言模型的性能预测模型进行性能估计,以及一种基于混合搜索算法的神经架构搜索方法,通过这些方法可以显著降低搜索时间并改善性能指标。