Sep, 2024

高性能机器学习推断的边缘人工智能平台基准测试

TL;DR本研究针对边缘计算中神经网络工作负载性能的差异,比较了CPU、CPU/GPU和CPU/NPU集成解决方案在执行线性代数和神经网络推断任务时的延迟和吞吐量。研究发现,NPU在矩阵-向量乘法和某些神经网络任务上表现优异,表明异构计算解决方案在边缘人工智能中的潜力可提高实时推断的准确性。