Mar, 2022

用于语言模型预训练在线优化的多臂老虎机:动态掩码的使用案例

TL;DR通过提出基于多臂老虎机算法的在线优化框架,对预训练超参数进行顺序选择以优化语言模型效果,并通过模型评价展示该算法有效性。