Oct, 2023

人为引导的复杂度控制抽象

TL;DR我们通过调整表示分布的熵,训练神经模型生成一系列离散表示,并在微调实验中展示了将表示调整到任务适当复杂度水平支持最高微调性能,并通过离散表示的可视化帮助用户在下游任务中识别适当的复杂度水平,这为利用人类洞察力快速微调模型指明了一个有希望的方向。