BriefGPT.xyz
Ask
alpha
关键词
layers
搜索结果 - 3
基于样例的动态分层 Transformer:通过上下文强化学习实现层和头的灵活性
通过解决上下文赌博问题动态配置层数和头数,我们提出了一种基于样本的动态层级变压器模型(DHT),与先前关注于仅推理的训练网络压缩不同,DHT 不仅有优势用于训练期间自适应优化底层网络架构,而且具备高效推理的灵活网络结构,得到高达 74%的计
→
PDF
7 months ago
图神经网络的图归一化学习
本文提出了通过优化四个不同层面的加权组合来学习图归一化的方法,其中包括节点归一化、邻接归一化、图归一化和批归一化。在不同数据集和任务中,学到的权重可以选择最优的归一化技巧,实现竞争性结果。
PDF
4 years ago
使用递归卷积网络理解深层结构
本文考察卷积神经网络中层数、特征图数量和参数数量对模型性能的影响,结果表明,增加层数和参数数量都有明显改善,而特征图数量(和表示的维度)对模型性能影响较小,更应关注这些层中的参数数量。
PDF
11 years ago
Prev
Next