Dec, 2021

开放域问答只需一个模型

TL;DR本研究提出了一种基于transformer架构的内部逐层注意力机制,将知识库搜索模型和重排模型整合为统一的模型,并进行端到端训练,以实现高效利用模型容量并提高梯度流量。该模型可以在固定参数预算内显著优于现有模型,达到1.0和0.7的精准匹配得分。