BriefGPT.xyz
Ask
alpha
关键词
memory compression
搜索结果 - 4
在线连续学习中的样本压缩
本文提出了一种新的重放式连续学习策略 OLCGM,使用知识压缩技术持续压缩记忆并更好地利用其有限的内存大小,取得了比现有重放策略更高的最终准确性。
PDF
2 years ago
GOBO: 基于量化的注意力自然语言处理模型,实现低延迟和高能效推断
GOBO 是一种模型量化技术,将当前 BERT 模型的大部分参数从 32 位浮点数压缩到 3 位,无需调整或重新训练即可同时保持其准确性,在硬件上可用于内存压缩和流量减少.
PDF
4 years ago
产品 Kanerva 机:分解贝叶斯记忆
介绍了 Product Kanerva Machine,它是一种具有分层结构的贝叶斯模型,通过动态组合许多较小的 Kanerva Machines,实现了大规模存储和压缩。它展示了成簇、罕见和组合分配模式,并发现了近似于通过对象对简单图像进
→
PDF
4 years ago
移动设备上的个性化语音识别
本文介绍了一种大词汇量语音识别系统,其特点是准确、延迟低,同时其内存和计算资源占用不大,可以在 Nexus 5 Android 智能手机上以快于实时的速度运行。使用一种量化的 LSTM 音频模型和 CTC 训练直接预测音素目标,进一步使用基
→
PDF
8 years ago
Prev
Next