Apr, 2022

Redwood: 使用碰撞检测来构建大规模意图分类数据集

TL;DR本研究介绍了一种用于检测语义重叠的多个数据集之间的任务 —— 意图碰撞检测,并利用该方法构建和基准测试了一个包含 13 个原始意图分类数据集中的 451 个意图类别的数据集 Redwood,是目前公开提供的最大的意图分类基准数据集之一。