BriefGPT.xyz
Ask
alpha
关键词
risk score
搜索结果 - 2
通过帕累托最优自我监督实现大型语言模型的自动校准和误差修正
本文提出了一种 Pareto 最优的自我监督框架,该框架可以利用可用的程序监督来系统地校准 LLM 响应,为每个响应产生风险分数,从而不需要进行任何额外的人工努力。
PDF
a year ago
学习优化风险评分
通过机器学习方法中标度、稀疏、整数系数和适应特定应用限制的混合整数非线性规划的切割平面算法来改进现有的风险评分模型,并更好地适应实际应用场景,比传统启发式方法更具优势和实际意义。
PDF
8 years ago
Prev
Next