Apr, 2024

温度网络遇见大型基础模型:通过 DRO 冷却还是不冷却?

TL;DR本文提出了一个基于约束分布稳健优化(DRO)的有稳健性损失下的小而通用的温度预测网络(TempNet)的学习框架,并给出了相应的温度参数的定义和训练方法,实验证明 TempNet 可以显著改善现有解决方案或模型的性能。