BriefGPT.xyz
大模型
Ask
alpha
关键词
mixtures of experts
搜索结果 - 3
强化学习设置中的专家混合模型
以增加参数计数、减少休眠神经元为特点的协同专家模型在深度强化学习中显著提升性能,通过多任务训练模拟非稳态性的扩大,进一步增强学习能力,并探索最佳使用戏剧评论理论网络中的协同专家组件的方法。
PDF
8 days ago
扩散策略的变分蒸馏成为专家混合模型
Variational Diffusion Distillation (VDD) 是一种将预训练的扩散模型提取为混合专家模型 (MoE) 的方法,结合了扩散模型的表达能力和混合模型的优势,通过分解性上界的变分目标训练每个专家,从而在复杂行为
→
PDF
16 days ago
分布式学习专家混合模型
提出了一种分布式学习方法,用于构建一个由本地估计器并行拟合数据子集所组成的大的混合专家模型,通过最小化期望的运输散度来聚合这些本地估计器,并通过提出的主导 - 最小化算法来构造一种计算规模高效的降维估计器。对实验中的统计和数值属性进行了研究
→
PDF
7 months ago
Prev
Next