Jun, 2023

锥头族:层次感知注意力

TL;DR本文介绍了锥形注意力机制,这是一种用于捕获层次关系的方法,它使用双曲锥体度量数据点之间的相似度,并在各种模型和任务中实现了更好的性能。