BriefGPT.xyz
Ask
alpha
关键词
character-level manipulations
搜索结果 - 1
使用类型层干预训练在基于子词的语言模型中引入字符级结构
该论文介绍了基于字符级别的操作(如拼写纠正、字谜游戏)对于基于子单词分词的模型非常具有挑战性。为了解决这个问题,作者采用了 Geiger 等人 2021 年的交互式干预训练方法,将其适应到基于字符的类型变量上。该方法可以在子单词分词模型的内
→
PDF
2 years ago
Prev
Next