BriefGPT.xyz
Ask
alpha
关键词
parallel inference
搜索结果 - 1
ICML
重访级联集成以提高推理效率
本文研究了一种简单的自适应推理方案,通过构建级联模型集成(CoE)并根据集成一致性作为数据依赖路由准则,将资源高效的模型逐渐扩展到更表达能力的模型,从而提高准确性并降低推理成本。
PDF
8 days ago
Prev
Next