QSAR 拟合的一致性预测方法的开发与评估

Apr, 2023

QSAR 拟合的一致性预测方法的开发与评估

Development and Evaluation of Conformal Prediction Methods for QSAR

Yuting Xu, Andy Liaw, Robert P. Sheridan, Vladimir Svetnik

TL;DR提出了针对最先进的机器学习模型，包括深度神经网络和梯度提升机的计算有效的 CP 算法，可在一些数据分布的弱前提下生成有效预测间隔，为 QSAR 建模提供了新的工具。

Abstract

The quantitative structure-activity relationship (qsar) regression model is a commonly used technique for predicting biological activities of compounds using their molecular descriptors. Predictions from

qsar regression model prediction interval machine learning conformal prediction

发现论文，激发创造

深度学习模型不确定性的置信度量化

本文探讨了在深度神经网络中表示模型不确定性的 Conformal Prediction 框架，提出了一种新的基于概率方法的模型不确定性量化方法，并提供了可靠的边界用于计算不确定度。

Jun, 2023

Uni-QSAR: 分子属性预测的自动化机器学习工具

该论文提出了一个名为 Uni-QSAR 的深度学习自动机器学习工具，结合了分子表示学习和预训练模型，利用大规模无标签数据得到丰富的表示，优于 SOTA 并在药物发现领域具有实际用途。

Apr, 2023

量子共形预测：量子机器学习中可靠的不确定性量化

该论文提出了一种处理量子机器学习中普遍存在的不确定性的通用方法学，该方法可以在训练数据量有限、量子计算硬件噪声存在的情况下可靠地度量量子模型的不确定，并基于概率共同预测来达到对真实目标的可信度量。

Apr, 2023

机器学习中有效不确定性量化的共形预测方法的比较研究

过去几十年，数据分析和机器学习领域的大部分工作都致力于优化预测模型，并取得比现有模型更好的结果。然而，本文指出对于很多应用而言，更加重要的并非准确的预测，而是变异性或不确定性。本文进一步探讨了让每个人了解不确定性、意识到其重要性并学会拥抱而不是害怕不确定性的世界，对一种确定性估计准确性的具体框架 —— 被称为 “符合性预测” 的框架进行了细致研究。而且，无需对数据进行参数假设，这一非参数结果在渐近程度上也不必依赖大数定律，使得这个框架成为唯一值得称为 “无分布假设” 的框架。

May, 2024

自然语言处理的保形预测：一项概述调查

快速增长的大型语言模型和自然语言处理（NLP）应用对不确定性量化提出了关键需求，以减轻幻象等风险并提高关键应用中的决策可靠性。条件预测正在成为一个理论上健全且实用的框架，结合了灵活性和强有力的统计保证。它的模型无关性和无分布性质使其特别有希望解决源于 NLP 系统缺乏不确定性量化的现有缺点。本文对条件预测技术、其保证以及 NLP 中的现有应用进行了全面调研，指出了未来研究的方向和面临的挑战。

May, 2024

基于局部加权合拢预测的自动估值模型中的不确定性量化

非参数机器学习模型与符合预测是房地产市场数据中准确预测房屋价格的方法，但由于地理空间上的依赖，直接应用符合预测在不同地理区域的置信区间不完全校准。本研究调查了各种方法来调整符合预测的置信区间以解决此问题，并在挪威奥斯陆房地产市场数据集上验证其性能。研究结果表明，在非一致性分数的 extit {局部加权} 版本上校准置信区间可以在不同地理区域中一致地进行校准。我们还在合成生成的销售价格上进行了模拟研究，从而在已知数据生成机制的理想条件下实证探索符合预测在房地产市场数据上的性能。

Dec, 2023

利用 E - 检验统计量增强符合性预测

使用 e 检验统计量引入 BB 预测器来增强符合性预测的效果，从而生成可靠的预测区间。

Mar, 2024

基于协变量偏移的密度估计的药物属性预测

使用 CoDrug 方法，结合能量模型和核密度估计，解决药物发现任务中的分布变化问题，提供有效的预测集并纠正协变量变化。与未调整协变量变化的 conformal prediction set 相比，CoDrug 能够减少超过 35% 的覆盖率差距。

Oct, 2023

一个温和的介绍：拟合预测及无分布不确定性量化

介绍一种无需分布假设或模型假设，可用于任何预训练模型（如神经网络）生成 100% 正确性置信区间（信赖区间）的方法，称之为一致预测；并提供了 Python 示例代码和 Jupyter 笔记本来说明此方法在计算机视觉、自然语言处理和深度强化学习等领域上的应用。

Jul, 2021

作物和杂草分类的组条件确认预测：基于分位数回归校准

基于深度学习的精准农业系统中，缺乏对高度复杂、不透明和不确定的模型的用户信任是自动化解决方案被采纳的一大障碍。本文介绍了一种提供对任何黑盒预测机器的预测性能进行有效统计保证的符合预测框架，应用于实际环境中的深度视觉分类问题。同时介绍了针对不同群体条件的符合预测方法，通过经验证实证了该方法的有效性并与现有方法进行了比较和讨论。

Aug, 2023