BriefGPT.xyz
Ask
alpha
关键词
asymmetric architecture
搜索结果 - 3
TIDE: 测试时间的少样本物体检测
通过引入非对称架构来学习一个支持实例引导的动态类别分类器,进一步提供交叉注意力模块和多尺度调整器以增强模型性能,从而显著优于现有的多个少样本目标检测方法。
PDF
7 months ago
ACL
通过嵌入对齐的查询编码器蒸馏是提升密集检索器在线效率的强大基准方法
本文中,我们提出了一个简单的基线方法,使用不对称架构来提高 Dual Encoder 检索器的效率。我们发现即使使用只有两层的 BERT-based 查询编码器,通过无监督的蒸馏和适当的学生初始化,仍然可以在 BEIR 基准测试中保持 92
→
PDF
a year ago
ACL
大规模重访非自回归翻译
本文系统研究了缩放对非自回归翻译的影响,发现缩放可以缓解其模型的弱点,并提升其翻译性能。同时,作者还研究了 NAT 编码器和解码器对翻译性能的影响,并建立了新的基准数据集作为未来研究的强有力基础线。
PDF
a year ago
Prev
Next