Dec, 2023

大规模语言模型指令调优的超参数优化

TL;DR研究采用黑盒优化技术通过 LoRA 方法调优大型语言模型的超参数选择,以提高性能和人工对齐。