BriefGPT.xyz
大模型
Ask
alpha
关键词
label-supervised adaptation
搜索结果 - 1
标签监督的 LLaMA 微调
本文介绍了一种基于标签监督的适应大语言模型(LLMs)的方法,通过从 LLMs 提取潜在表示并将其投影到标签空间计算交叉熵损失来微调模型。在各种下游任务中,该方法显著优于比其十倍规模的 LLMs 以及其他强大的基线模型如 BERT-Larg
→
PDF
9 months ago
Prev
Next