Oct, 2023

LLM 性能预测模型为架构搜索提供良好初始值

TL;DR使用大型语言模型构建性能预测模型,并在机器翻译和神经架构搜索领域展示出优越的性能,同时提出基于大型语言模型的性能预测模型进行性能估计,以及一种基于混合搜索算法的神经架构搜索方法,通过这些方法可以显著降低搜索时间并改善性能指标。