Nov, 2023

文本处理对表格数据的分类

TL;DR自然语言处理技术在过去十年中取得了巨大的进展。本文提出了一种新颖的框架,基于文本的分类 (TBC),它利用最先进的文本处理技术来解决表格数据上的分类任务。我们提供了一组受控实验,展示了使用这种方法相对于其他分类方法的优势。在几个数据集上的实验结果还表明,该框架在预测类别的准确性、精确性和召回率方面达到了与几种最先进模型相当的性能。