BriefGPT.xyz
Ask
alpha
关键词
squared error loss
搜索结果 - 5
线性回归的私有梯度下降:更紧凑的误差界限和特定实例的不确定性估计
我们对标准差分隐私梯度下降方法在线性回归中的分析进行了改进,得出基于输入的合理假设,在每个时间步骤上迭代的分布特征。我们的分析结果揭示了算法的准确性新的发现:对于适当选择的超参数,样本复杂度仅与数据维度呈线性关系。这与(非私有)普通最小二乘
→
PDF
5 months ago
利用优势引导的策略对齐对语言模型进行微调
本研究提出了一种新算法 APA,利用估计的优势建立基于平方误差损失函数的算法进行优化,证明在使用单独的奖励模型作为评估器时,APA 明显优于 PPO,并且在控制模型初始策略与改进性能之间提供更稳定的形式控制,避免了模式崩溃、不稳定性和样本效
→
PDF
a year ago
ICLR
深度神经网络的全局最优条件
该论文研究了使用平方误差损失函数的深度线性和非线性神经网络的误差景象。对于深度线性神经网络,研究者提出了必要和充分条件,以判断风险函数的一个临界点是否为全局最小值,并且这些条件提供了一种高效检查全局最优性的方法。论文还将这些结果扩展到深度非
→
PDF
7 years ago
NIPS
一种用于序数分类的简单平方误差重构方法
本文探讨了基于深度神经网络的序数分类问题,通过对均方误差损失函数的简单修改,使其可以敏感地处理类别排序,同时还能获得各个类别的离散概率分布。我们基于 softmax 隐藏层提出了一种新的算法,经实验在 Kaggle 糖尿病性视网膜病变数据集
→
PDF
8 years ago
通过 $k$- 最近邻距离高效估算多元熵
本文提出一种基于加权平均值的熵估计器,利用 $k$- 最近邻距离和加权项来实现局部渐进极小化极小化损失下的效率估计,可以在任意维度上获得高效估计,并促进了渐近最小宽度熵的置信区间的构建。
PDF
8 years ago
Prev
Next