BriefGPT.xyz
Ask
alpha
关键词
hierarchical fine-tuning
搜索结果 - 2
Ladder:将基于 LLM 的机器翻译推向更高层次的模型无关框架
通过使用 Ladder,我们开发了一种新颖的与模型无关且成本有效的工具,用于改进用于机器翻译的通用 LLMs 的性能。通过在现有 LLMs 中获得的伪精炼三元组进行训练,Ladder 可以逐步改进其精炼性能,并与任何通用 LLMs 无缝集成
→
PDF
18 days ago
缓解连续微调中的表征漂移
本文提出了一种包含两个组件(交叉卷积批量规范化和分层微调)的微调方法 ConFiT,旨在解决表示转移和批量规范化不一致的问题,并在四个数据集上得到了较低存储开销的优异性能表现。
PDF
2 years ago
Prev
Next