BriefGPT.xyz
大模型
Ask
alpha
关键词
output distribution
搜索结果 - 4
使用分支界限法对神经网络进行概率验证
用具有适当启发式条件的一组算法基于神经网络的输出分布来验证其概率,同时计算和迭代优化神经网络输出概率的下界和上界,并通过应用非概率性神经网络验证中的最先进的边界传播和分支约束技术,显著提高了解决时间。
PDF
a month ago
MetaRM: 通过元学习实现偏移分布对齐
利用元学习来解决环境分布变化引起的强化学习中奖励模型难以区分响应以及难以泛化到新例子的问题。
PDF
2 months ago
预训练的 Transformer 是否真的通过梯度下降来学习上下文?
在实际的自然语言环境中,对比了 In-Context Learning (ICL) 和 Gradient Descent (GD) 在语言模型上的表现差异,发现二者在适应语言模型的输出分布上存在不一致的行为。
PDF
9 months ago
基于梯度的 Wang-Landau 算法:神经网络在输入空间输出分布的新采样器
本文提出了梯度基于的 Wang-Landau 采样算法,以更高效地探索神经网络的输出分布于输入空间之间的关系,实验结果在二元图像分类任务中,CNN 和 ResNet 把大多数不可识别的图片映射至负 logit 值。
PDF
a year ago
Prev
Next