May, 2023

模仿专有 LLM 的虚假承诺

TL;DR该研究论文分析了在弱语言模型上进行迁移学习的方法,通过仿效 ChatGPT 这样的专有模型,使用较弱的开源模型来廉价模拟专有模型的功能。论文指出,目前这种方法是不可行的,最好的方法是发展更好的基础模型来提高开源模型的性能。