EMNLPNov, 2023

像素语言模型的文本呈现策略

TL;DR像素模型的渲染策略对语言模型的性能有重要影响,使用字符二元组渲染能够提高模型的性能,同时在句子级任务上不会降低处理标记和多语言任务的性能,还能以只有 2200 万参数的更小模型达到与原始 8600 万参数模型相当的性能,分析表明字符二元组渲染产生了更好的模型,但由于补丁频率偏差而导致异性的补丁嵌入空间,突显了图像补丁和记号化语言模型之间的联系。