Jun, 2024

记忆即一切:加速大型语言模型推理的计算于内存架构综述

TL;DR大型语言模型的推出带来了自然语言处理领域的重大变革,本文调查了与转换器模型有关的各种 CIM 构架以及它们如何解决现代人工智能计算系统面临的挑战。