BriefGPT.xyz
Ask
alpha
关键词
dt-fixup
搜索结果 - 1
ACL
在小数据集上优化深度 Transformer
本文指出对于少量数据集的挑战性任务,如文本到 SQL 语义解析和逻辑阅读理解等,使用预训练模型进行微调是不必要的。通过新型数据依赖 Transformer 固定更新初始化方案(DT-Fixup),我们成功训练了由 48 个 transfor
→
PDF
4 years ago
Prev
Next