Oct, 2023

自我注意力与时间先验:我们能从时间的箭头中学到更多吗?

TL;DR我们提出了一种简单而高效的方法,通过在注意力矩阵上直接应用可学习的自适应卷积核,使注意力层能更好地编码这些数据集的短期时间偏差。在实验中,我们选择了使用电子健康记录(EHR)数据集的各种预测任务,因为它们是具有底层长期和短期时间依赖性的绝佳示例。我们的实验结果表明,在大多数任务和数据集上,与表现最佳的模型相比,我们的分类结果非常出色。