Mar, 2024

CleanAgent:基于LLM的智能化数据标准化

TL;DR我们提出了一个Python库,使用声明性的统一API来标准化列类型,简化LLM的代码生成过程。通过一行代码,我们的库可以显著降低复杂性并实现特定列类型的标准化。而且我们引入了CleanAgent框架,将Dataprep.Clean和基于LLM的agents集成,实现自动化的数据标准化过程。使用CleanAgent,数据科学家只需提供一次要求,即可实现无人工干预的自动标准化过程。