Oct, 2024
不太可能的双字组揭示了字节级分词器中不完整标记的脆弱性
Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in
Byte-Level Tokenizers
TL;DR本研究针对字节级字对编码分词中的不完整标记问题,提出不太可能的双字组概念,以揭示这些标记在与不熟悉的标记配对时的脆弱性。实验表明,这些双字组显著增加了生成虚假内容的风险,而采用其他分词方法则显著降低了这种风险。因此,研究指出字节级BPE分词器可能带来的潜在脆弱性,影响可信语言模型的开发。