Feb, 2023

RetVec: 弹性和高效的文本向量化

TL;DR本文介绍了 RetVec,一种用于神经文本处理的弹性多语言嵌入方案,包括小文本分类和大型语言模型,将单词嵌入到256维向量空间中,与最先进的标记器和词嵌入进行比较,这些比较证明了RetVec能够构建具有鲁棒性的文本模型,并且更加抗干扰。