May, 2022

探索在超出范围检测任务中利用密集向量和独热编码对意图类别的优势

TL;DR本文研究了使用一种流行的 one-hot 编码方法进行意图分类时,当需要检测超出范围的输入时,其固有限制。我们通过比较基于领域特定知识的密集向量和 one-hot 编码技术,探讨了大规模自然语言处理中 OOS 探测的问题,实验结果表明,知识无关,随机生成的密集向量编码比 one-hot 编码技术可以显著提高 OOS 检测性能。同时,我们提出了一种新的算法来搜索好的密集向量编码并对其进行了初步的实验结果分析。