- 基于统计检验理论视角对于外域识别的观点
我们研究了在监督学习和无监督学习环境中在测试时高效检测超出分布(OOD)样本的问题。通过统计检测重新定义 OOD 问题,研究了在统计术语中使 OOD 问题可识别的条件,并在 Wasserstein 距离的基础上研究了 OOD 测试的收敛性保 - COLING从文档级分布估计词汇复杂性
我们开发了一种两步方法来评估词汇复杂度,不需要任何预先注释的数据,并且我们验证了该方法在挪威语中的有效性,并通过统计测试和对真实评估工具样本进行定性评估来调查复杂度测量与文献中通常与复杂度相关的某些特征之间的关系。
- 变分自编码器用于异常检测的统计检验
利用统计检验方法提出了 Variational Autoencoder(VAE)在异常检测中的可靠性评估方法,该方法能够量化通过 VAE 检测到的异常区域的统计可靠性,并且可以控制误检的概率。
- AI 系统的功能可信度:基于统计有效测试
欧盟人工智能法案草案及伴随的标准化努力对人工智能系统的符合评估存在问题,不考虑实际的功能可信度和责任归属,而可靠的功能可信度评估应该是符合评估的核心。
- IJCAI基于经验贝叶斯方法的鲁棒性基于约束因果发现在不充足数据下的应用
通过引入贝叶斯 - augmented 的频率独立性检验方法,可以解决数据量不足的问题来改善局限于有限数据的约束性因果发现方法的性能,由实验也表明相比于目前最佳方法在精确度和效率方面都有显著提高。
- 分布偏移下的统计检验
本文介绍了在分布偏移下的统计检验,提出了一种通过重新采样构建辅助数据集的一般化检验方法,可用于处理强化学习和因果推断等多个领域的问题。
- 利用统计学自动化随机优化
提出一种基于统计检验的适应性方法,通过检测随机梯度下降算法的动态变化达到均衡状态后衰减学习率,解决了手动调参的繁琐问题,实现了类似于手动调参的性能并在多个深度学习任务中得到了验证。
- 强化学习算法的统计比较指南
本文介绍了一份关于如何严格比较增强学习算法的指南,包括介绍了统计测试的概念、审查相关的统计测试以及比较它们在不同的样本量和效果量下的假阳性率和统计功效。除了通过模拟比较不同测试之外,我们还在 Half-Cheetah 上比较了 Soft-A - 检测差分隐私违规
本研究使用统计方法产生小而可理解的反例来检测有关差分隐私保护的算法中可能发生的违反隐私保护的错误,此方法可以有效地检查算法的正确性并帮助开发者快速调试。
- 使用堆叠泛化进行母语识别
我们用三种基于 Ensemble 的模型进行了一系列实验,测试了每种模型的多个配置和算法,并达到当前不同语言三个数据集中 NLI 的最高水平,同时我们还使用了统计显著性检验来比较 NLI 系统,展示我们的结果明显优于以往最佳水平,并提供了一 - NIPS估计器组合的稳健性
本篇论文阐述了复合估计器的鲁棒性与容忍性的概念及计算方式,证明了复合估计器的容忍性等于个别估计器的容忍性的积,并分析了回归和统计测试等多个场景的最坏情况下的稳健性。
- 经验 Wasserstein 距离的极限定理:高斯分布
该研究探讨了高斯样本经验分布之间的 Wasserstein 距离的中心极限定理,提出了根据 Wasserstein 距离在高斯样本中的自由勒什特可微性进行区分的方法,并讨论了对椭圆对称分布的扩展以及引导重抽样和统计检验等若干应用。