BriefGPT.xyz
Ask
alpha
关键词
mobile-friendly generative language models
搜索结果 - 1
Merino: 基于熵驱动的生成式语言模型设计以应用于物联网设备
我们提出了一种新颖的信息熵框架,用于设计面向移动设备的生成式语言模型。我们通过最大化给定计算预算内的 Transformer 解码器的熵来进行关键设计,从而在数分钟内在 CPU 上解决数学规划问题,几乎为零成本。我们评估了我们设计的模型 M
→
PDF
5 months ago
Prev
Next