Jan, 2024

语言模型作为层次编码器

TL;DR利用超几何空间重新训练语言模型中的分层转换器编码器(Hierarchy Transformer encoders,HiTs),为回归语言模型中隐含的分层结构提供了一种新的方法,通过聚类与层级组织相关实体来提高在推论、预测和跨层次知识传递等任务中的性能和可转移性。