BriefGPT.xyz
大模型
Ask
alpha
关键词
model structure
搜索结果 - 3
探究预训练对时间序列分类的影响
预训练和微调对于数据拟合不佳的模型能够帮助优化过程,但对于拟合较好的模型则没有这种效果;当给予足够的训练时间时,预训练不会表现出正则化的效果;预训练只能加速收敛,前提是模型具备足够的拟合能力;增加更多的预训练数据不能改善泛化能力,但可以增强
→
PDF
10 months ago
MulGAN:基于样例的人脸属性编辑
本文中提出的基于属性标签限制的模型,可以通过在预定义的潜在特征空间中直接应用属性标签并使用属性分类损失,从图像中提取属性相关信息,以实现用于编辑多个属性的面部属性传输,同时通过设计新的模型结构来提高属性传输能力。在 CelebA 数据集上的
→
PDF
5 years ago
ACL
神经成分句法分析器的研究分析
研究了现代和经典的组成分析方法的差异,以及神经网络在此领域的应用。高性能的神经模型代表了最新的工作,实验发现该模型隐式编码了过去语法和词汇表明确提供的信息,暗示这种支撑可以被强大的通用神经机制取代。
PDF
6 years ago
Prev
Next