关键词hierarchical ranking loss
搜索结果 - 2
- 重新审视话语论以进行对话分离
本文提出了一种基于异构图表示的对话解缠方法,构建了不同的讨论结构特征模型,包括静态发言角色结构和动态背景结构,并采用层级排名损失和易于首先解码算法来实现话语理解和分离。
- ACL神经机器翻译知识蒸馏理解与改进探究
本文研究神经机器翻译中知识蒸馏的技术,发现知识来源于教师的 top-1 预测,进一步提出一种名为 TIE-KD 的方法用于增强知识蒸馏,包含了层次排序损失和迭代蒸馏等措施,实验证明 TIE-KD 优于基准模型,具有更高的潜力和泛化性能。