Jul, 2023

关于注意力网络学习动态

TL;DR关注模型有三种不同的潜在变量边际可能性(LVML):软关注、硬关注和软关注损失。我们观察到使用这些范例学到的模型具有独特的特征,并且提出了一种简单的混合方法,结合了不同损失函数的优点。