BriefGPT.xyz
Ask
alpha
关键词
petra
搜索结果 - 2
PETRA: 并行端到端训练与可逆架构
我们介绍了一种用于并行计算深度模型训练的 PETRA 替代方法,它通过反向传播和单一参数版本的保持来解决权重存储的问题,并在 CIFAR-10、ImageNet32 和 ImageNet 上展示了其与后向传播相比具有竞争性的准确性。
PDF
a month ago
ACL
PeTra: 一种用于人员追踪的稀疏监督记忆模型
PeTra 是一款记忆增强的神经网络,旨在跟踪其记忆槽中的实体,并通过稀疏注释从 GAP 代词分辨率数据集中进行训练,其在任务上的表现优于先前的记忆模型。通过对关键建模选择进行实证比较,发现我们可以简化多个方面的内存模块设计同时保持强大性能
→
PDF
4 years ago
Prev
Next