BriefGPT.xyz
Ask
alpha
关键词
verification methods
搜索结果 - 4
思维链的强弱取决于最薄弱一环:推理链验证器的基准评估
我们引入了 Reveal:推理验证评估,这是一个新的数据集,用于在开放域问题回答设置中评估复杂的链式推理的自动验证器,包括语言模型的答案中每个推理步骤的相关性、证据归因和逻辑正确性的全面标签。
PDF
5 months ago
自动驾驶数据集上的离群样本检测性能评估
通过应用基于最可能的类条件高斯分布的 Mahalanobis 距离作为 OOD 分数来评估拒绝语义分割 DNN 的输出,该研究发现即使在未知数据集上应用,也可以显著降低分类风险,但会以像素覆盖率为代价。这些发现的适用性将有助于合法化安全措施
→
PDF
5 months ago
通过网络简化加快神经网络验证
通过消除稳定的 ReLU 神经元并将其转化为由 ReLU 和仿射层组成的顺序神经网络,我们提出了一种网络削减技术作为预处理方法以便于验证,实验证明这种技术能够显著减小神经网络规模并加快验证过程。
PDF
a year ago
通过影子价格实现快速神经网络验证
本研究介绍了一种基于影子价格的新技术,可以更高效地对神经网络进行验证,降低了计算时间,同时也为视觉和控制等各种机器学习应用提供了改进的验证方法。
PDF
5 years ago
Prev
Next