Jan, 2023

转换器作为算法:上下文学习中的泛化和稳定性

TL;DR本文介绍了in-context learning (ICL)的概念和算法及其在multitask learning领域的应用,提出了使用transformer model的方式,详细探讨了ICL在 i.i.d. 和动态数据下的泛化界限及其稳定性,以及任务复杂度和MTL任务数量对转移学习风险的影响。最后,提出了数值评估,并验证了理论预测。