Aug, 2023

biquality-learn: 一个用于双质量学习的 Python 库

TL;DR数据挖掘的民主化得到了广泛成功,其中强大且易于使用的机器学习库在其中发挥了重要作用,然而,实践中强监督信号稀缺,研究者必须采用弱监督方法,并且在将机器学习模型部署到现实世界中时,数据集的偏移也是一种常见现象,因此提出了一种名为 Biquality Learning 的机器学习框架,可处理多种弱监督和数据集偏移问题,而不对其性质和程度做出假设,依赖于一个小型可靠的数据集,该数据集由清晰标记和具有代表性的样本组成,因此我们提出了 biquality-learn,一个用于 Biquality Learning 的 Python 库,具有直观一致的 API,可以从 biquality 数据中学习机器学习模型,拥有经过验证的算法,对任何人都易于访问和使用,并使研究人员能够对 biquality 数据进行可重复的实验。