- 学习指标以最大化加速 A/B 测试的功效
通过从短期信号中学习指标,我们能够提高在线控制实验的统计功效,减少实验成本,同时有效降低 type-II 错误。
- 公平审计的样本容量计算简明教程
公平审计中,确定所需子群样本量以最大化假设检验的统计功效对于获得信息丰富的公平评估至关重要,本文解决了这些问题并提供了相关指导,适用于二元分类模型的审计和多种公平度量方法的总结。此外,文章还讨论了其他可提高审计结果可靠性的研究方法设计方面的 - DeepROCK:深度神经网络中的误差受控交互检测
利用人工合成数据和一种新的深度神经网络架构,可以控制误发现率并实现最大统计功率,提高 DNN 的可解释性。
- 教程:簇分析、潜在类分析和多元混合模型的样本量、效应大小和统计功效的先验估计
在确定样本量和效应量时,本文介绍了一种程序,用于形式化研究者对所选择领域的效应量的预期,从而计算所需的最小测量变量数量,同时还概述了确定子群分析的最小样本量的方法,并使用模拟提供了常用子群分析方法(k 均值,Ward 层次聚类,c 均值模糊 - 一种无模型的监督学习特征影响程度检测方法
本文提出了一种新的方法来测试模型中不同特征对响应值的影响,能够适用于线性回归和高斯混合模型,并证明了该方法在足够样本数量下能达到完全的统计功效。
- ICMLPowerGraph:利用神经网络和主成分确定多元统计功率权衡
为了解决多元问题下统计功效估计与灵敏度分析的计算瓶颈,文中探讨了一种基于机器学习模型的简单通用解决方案,可将计算成本降至原方法的 10% 以内,并在提供良好 F1 得分的同时,进一步阐述了在跨分布学习能力的学习能力对于提高统计功效估计精度的 - EMNLP微弱的力量带来巨大的责任
该论文通过元分析现有的自然语言处理论文和数据集,表征了一系列设置的典型统计功率,最终得出结论,在自然语言处理文献中,实验功率不足是常见的。作者还概述了 NLP 统计功率分析的最佳实践,并发布了一系列笔记本来帮助未来的研究者进行统计功率分析。
- 差分隐私非参数假设检验
本研究研究了不同隐私性的统计假设检验方法,包含常规与非参数检验方法,并使用特定于隐私数据的新型检验统计量,比较结果表明,我们的新型非参数检验方法在统计功效上有巨大改进。
- 功效轮廓:优化实验心理学和人类神经科学的样本量和精度
本文探讨了实验参与者试验中试验次数和参与者数量对统计力量的影响,并演示了在常用实验范式中,当被试内的方差与被试间的方差相比较大时,试验次数具有意义的影响,提供了一个在线工具来生成功率轮廓,并计算出最佳的试验和参与者组合.
- 差分隐私 ANOVA 测试
提出了第一个用于方差分析(ANOVA)的差分隐私算法,以保护个人隐私为前提,确保数据的汇总统计特征可供研究人员使用,同时实现有效的实验结果测量。
- 多重测试校正下的重要子图挖掘
通过对八个流行图形基准数据集进行实证调查,本文回答了一个开放性问题,即排除无法测试的假设是否也会提高子图挖掘的统计功率,并提出了一种新的高效搜索策略,极大地提高了统计功率。