BriefGPT.xyz
大模型
Ask
alpha
关键词
reranker model
搜索结果 - 1
EMNLP
开放域问答只需一个模型
本研究提出了一种基于 transformer 架构的内部逐层注意力机制,将知识库搜索模型和重排模型整合为统一的模型,并进行端到端训练,以实现高效利用模型容量并提高梯度流量。该模型可以在固定参数预算内显著优于现有模型,达到 1.0 和 0.7
→
PDF
3 years ago
Prev
Next