研究感应阵预测模型中的数据使用
本研究提出基于收缩预测算法的文本填充和词性预测算法,并将其应用于自然语言数据处理中。通过在波士顿语料库中进行仿真实验,结论表明该算法能够生成有效的置信区间,并在机器语音转录中有改进应用。
Nov, 2021
在这项工作中,我们使用 PAC-Bayes 理论获得了关于集合值预测器的覆盖率和效率的泛化界限,可以直接优化以最大化效率,同时满足所需的测试覆盖率,并利用这些理论结果提供了一种利用校准数据对模型和评分函数的参数进行微调,并确保所得预测集的测试覆盖率和效率的实际算法。
Dec, 2023
通过建立基础预测器的泛化性能与条件概率预测集成信息量之间的理论连接,本研究推导了一个上界,以便理解条件概率预测集的平均大小对校准数据量、目标可靠性和基础预测器的泛化性能的依赖关系。通过简单的数值回归和分类任务验证了理论洞察的有效性。
Jan, 2024
本研究利用信息论来将符合预测与其他不确定性概念相联系,并证明了三种不同的方法来上界内在不确定性,同时通过符合预测和信息论不等式的组合,实现了两种直接有用的应用:(i)更规范和有效的符合训练目标,从头开始实现机器学习模型的端到端训练,(ii)将旁路信息纳入符合预测的自然机制。我们在集中式和联邦学习环境中进行了实证验证,并证明了我们的理论结果能够转化为流行的符合预测方法的低效性(平均预测集大小)。
May, 2024
通过两种新方法 ECP 和 EACP,根据基模型在未标记测试数据上的不确定性调整 CP 中的评分函数,从而仅使用测试域中的未标记数据改进 CP 生成的预测集的质量。通过对许多大规模数据集和神经网络架构进行广泛实验,我们展示了我们的方法相对于现有基准算法的持续改进,并几乎与监督算法的性能相匹配。
Jun, 2024
该研究提出了一种新颖的 conformal prediction(CP)方法,通过找到一组有前途的预测候选项而不是单个预测,以适合许多开放式分类任务,实现包含正确答案的高概率且适用于自然语言处理和药物发现等多个应用领域,同时实现降低预测集的大小和费用摊销等效果。
Jul, 2020
本文研究了使用最大预测效率作为优化目标训练归纳一致预测器(inductive conformal predictor)的方法,将对可用于分类的归纳一致预测器进行了特别关注,并在几个真实数据集上进行了测试,结果表明该方法在大多数情况下相对于基线一致预测器具有更高的预测效率。
May, 2021