BriefGPT.xyz
Ask
alpha
关键词
sparse parameters
搜索结果 - 3
隐藏的协同作用:$L_1$ 权重归一化与 1 - 路径 - 范数正则化
提出了一种名为 PSiLON Net 的 MLP 架构,利用 $L_1$ 权重归一化来处理每个权重向量,并在层间共享长度参数。通过简化 1-path-norm 并提供对高效学习和近稀疏参数的归纳偏差,设计了 PSiLON Net。同时,提出
→
PDF
2 months ago
稀疏线性强化学习问题中,用于贪婪算法的新类臂特征分布
在这篇论文中,我们考虑了稀疏背景下的上下文强化学习问题,其中臂特征通过稀疏参数的内积影响奖励。我们证明了贪心算法适用于更广泛的臂特征分布,提出了与高斯混合、离散和径向分布相关的新分布类,确保样本的多样性,从而为贪心策略在非常广泛的臂特征分布
→
PDF
7 months ago
KDD
JIZHI: 用于百度规模在线推理的快速经济的模型即服务系统
JIZHI is a Model-as-a-Service system for online real-time inference serving, which employs Staged Event-Driven Pipeline,
→
PDF
3 years ago
Prev
Next