BriefGPT.xyz
大模型
Ask
alpha
关键词
training regimes
搜索结果 - 4
值为基础的深度强化学习中超参数选择的一致性
深度强化学习在各个领域取得了巨大的成功,本文通过算法设计和精心选择超参数的结合实现了算法的改进,重要超参数的选择对性能有很大的影响,本文通过广泛的实证研究,引入了一个新的指标来确定各种超参数的一致性和可靠性,并明确了在不同的训练模式下仍然保
→
PDF
9 days ago
ICLR
523 个 Imagenet 分类器的选择性预测和不确定性估计性能有什么可学之处
本文考察 523 个现有的深度图像分类器在选择性预测和不确定性估计性能方面的表现,发现蒸馏型训练方案普遍比其他训练方案具有更好的估计不确定性的能力,ViT 模型在不确定性估计方面的表现超过其他模型。
PDF
a year ago
理解连续学习中训练策略的作用
通过研究不同的训练规则,如 dropout、学习率衰减和 batch size 等,以形成训练模式,从而扩大任务的局部极小值,在帮助神经网络避免灾难性遗忘方面提供了实用的见解。
PDF
4 years ago
NIPS
针对深度学习动态和可解释性的奇异向量正则相关分析(SVCCA)
提出了 Singular Vector Canonical Correlation Analysis(SVCCA)技术,用于快速比较两个表示方式,并测量网络层的内在维度、学习动态、类特定信息和建议新的训练方案。
PDF
7 years ago
Prev
Next