BriefGPT.xyz
Ask
alpha
关键词
model soups
搜索结果 - 5
裂变融合:快速生成几何体和分层识别用于医学图像分析
通过采用层次化合并方法和周期性学习率调度器,本研究在医学图像领域得到显著的性能提升,比模型组合方法在多个数据集上(如 HAM10000 和 CheXpert 数据集)提高了 6%,同时保持了低的计算成本。
PDF
4 months ago
RADIN:在预算范围内煲汤
通过使用平均集成的日志绩效近似模型汤的性能,我们提出了一种加速模型汤的方法。理论上证实了集成日志与权重平均模型汤在任何混合比例下的一致性。我们的资源调整模型汤方法在允许灵活的评估预算的同时,相比以前的贪婪方法能够在更低的预算下提高性能(Im
→
PDF
5 months ago
稀疏模型汤:通过模型平均实现剪枝改进的配方
本文介绍了一种稀疏神经网络模型的组合方法,称为稀疏模型汤。该方法使用迭代剪枝技术,通过在众多超参数配置中重新训练模型以获得相同的稀疏性,从而使得多个稀疏模型之间的参数能够平均并且相容,从而增强了这些模型的泛化能力。
PDF
a year ago
ICML
图标贴:无中间通信的惊人简单并行 GNN 训练
本文提出了一种基于数据的模型汤算法,通过将巨大的图数据分割成多个相对较弱的 GNN,然后使用贪心插值汤过程组合它们的强度,从而改善 GNN 的扩展性能。在许多真实世界的小型和大型图上进行了广泛实验,结果表明该算法的有效性并且为 GNN 的扩
→
PDF
a year ago
ICML
模型集成:对多个微调模型的权重进行平均可提高准确度且不增加推理时间
通过平均训练以不同超参数配置微调的模型,提高现有模型的性能和鲁棒性,从而在多个图像分类和自然语言处理任务中达到新的最先进技术水平。
PDF
2 years ago
Prev
Next