BriefGPT.xyz
大模型
Ask
alpha
关键词
general knowledge
搜索结果 - 3
ACL
基于重要性的神经元分配在多语言神经机器翻译中的应用
本篇研究论文提出了一种新的多语言神经机器翻译模型,将模型神经元划分为通用部分和特定语言部分,以解决当前的多语言翻译方法忽略语言特定知识的问题。实验证明,该方法对于多种语言对有很好的效果和普适性。
PDF
3 years ago
AAAI
双向蒸馏的多视角特征表示在对话生成中的应用
本文提出一种基于知识蒸馏的对话模型训练框架,通过分组多任务学习、多视角特征蒸馏和双向蒸馏等策略,找到多数据集共性知识以提高模型泛化性能。实验结果表明该框架可以有效地提高模型的泛化性能,而不影响训练效率。
PDF
3 years ago
ACL
机器阅读理解中的通用知识显式利用
本文提出了一种基于数据丰富的方法,提取给定语料对中的语义联系作为人类的通用知识,并在此基础上构建了一种知识辅助的 MRC 模型,与业内领先 MRC 模型相比具有相当的性能和更强的抗干扰能力。
PDF
6 years ago
Prev
Next