BriefGPT.xyz
大模型
Ask
alpha
关键词
quadratic-probe loss
搜索结果 - 1
分子少样本学习是否真的需要元训练?
我们重新审视了更简单的精调方法,基于马氏距离提出了一种正则化的二次探针损失,设计了一种专用的块坐标下降优化器,达到了与现有方法相媲美的竞争性能,并且适用于黑盒设置,消除了特定的情节预训练策略的需求。此外,我们引入了一个新的基准来评估竞争方法
→
PDF
3 months ago
Prev
Next