BriefGPT.xyz
大模型
Ask
alpha
关键词
reconstruction ability
搜索结果 - 2
AAAI
理解和利用神经网络的学习阶段
通过对参数的演化,我们全面分析了深度神经网络的学习动态,发现存在三个阶段:接近恒定的重建损失、下降和上升。我们还通过经验实证建立了数据模型,并对单层神经网络证明了阶段的存在。我们的工作为迁移学习提供了新的最佳实践:通过实验证明预训练的分类器
→
PDF
7 months ago
预训练语言模型在非分布数据上的扩散效应是如何影响的?
使用 Transformer 预训练语言模型(PLMs)中的扩散模型降低了离群值鲁棒性,并提供了对离群样本的强力检测能力。
PDF
a year ago
Prev
Next