BriefGPT.xyz
大模型
Ask
alpha
关键词
query-pool regularization
搜索结果 - 1
一阶段基于提示的持续学习
通过引入一种单阶段的 PCL 框架,将中间层的标记嵌入作为提示查询,消除了查询 ViT 的额外前馈阶段,从而在训练和推理中将计算成本降低了约 50%,准确度仅下降不到 1%。此外,引入了查询池正则化损失(QR 损失),用于改进提示查询和提示
→
PDF
4 months ago
Prev
Next