BriefGPT.xyz
Ask
alpha
关键词
computation speedup
搜索结果 - 2
一次就够:一种轻量级的交叉注意力用于快速语句对建模
本文提出了一种高效的 MixEncoder 范式,它包括一种轻量级的交叉关注机制,可以在快速计算的同时实现可比较的性能,大大加速了句子配对。
PDF
2 years ago
ICLR
混合精度训练
介绍了一种使用半精度浮点数训练深度神经网络的技术,通过减少内存消耗和利用未来处理器的半精度硬件单元,大幅提高模型训练的计算速度。
PDF
7 years ago
Prev
Next