Mar, 2024
通过字符匹配实现标记对齐用于子词补全
Token Alignment via Character Matching for Subword Completion
Ben Athiwaratkun, Shiqi Wang, Mingyue Shang, Yuchen Tian, Zijian Wang...
TL;DR该论文研究了一种通过回溯和对齐机制来解决生成模型中的标记化问题,从而提高模型在处理部分输入时的性能。该方法对包括代码补全和文本自动完成在内的多种场景都有显著改善,同时只有轻微的时间成本增加。