Nov, 2024

通过标记翻译调整语言模型

TL;DR该研究解决了在新的目标领域中应用固定标记器导致的文本压缩效果差和推理成本高的问题。提出的稀疏Sinkhorn标记翻译(S2T2)方法,通过为目标领域训练量身定制的标记器,实现了源标记与目标标记之间的有效转换,显著提高了域外蛋白质序列的困惑度和压缩效果,且学习到的标记翻译可以有效迁移到更大的模型,降低成本。