BriefGPT.xyz
大模型
Ask
alpha
关键词
global representation
搜索结果 - 3
EMNLP
利用编码器早期融合创建全球概率空间以进行开放领域问答
通过扩展 Transformer 编码器的能力以融合信息,使用全局表示跨样本注意所有令牌,并提出了一种更好的答案跨度概率计算方法,我们使用与综合数据增强配对的方法,在推理期间只使用 25%的参数和 35%的延迟,在自然问题数据集上的精确匹配
→
PDF
2 years ago
面向视频识别的时序关注协方差汇聚网络
本文提出了一种基于时间注意力和内帧关联的计算方式 ——Temporal-attentive Covariance Pooling (TCP),它可以灵活地集成到任何视频架构中,用于生成强大的视频表示,它在六个基准测试中都表现出优异的性能,并
→
PDF
3 years ago
AAAI
全局表示增强的 Transformer 模型
本文提出了一种在 Transformer 网络中显式地建模全局表示的新方法 —— 全局表示增强的 Transformer(GRET),并将其应用于机器翻译和文本摘要两个文本生成任务中,并通过实验证明其在自然语言生成方面的有效性。
PDF
4 years ago
Prev
Next