May, 2023

Java-based张量计算框架Dragon-Alpha&cu32 与其高性能CUDA库

TL;DR Dragon-Alpha是一个Java语言的Tensor计算框架,具有易用性、可扩展性和高性能,支持不同层次的API,并具有聚合异构平台和设备的潜力,其使用异步API和高度优化的CUDA库cu32可训练一些典型的神经网络(AlexNet、VGG、GoogleNet、ResNet)的时间和内存成本比PyTorch & cuDNN更低。