Nov, 2023

测试 RadiX-Nets:可行稀疏拓扑结构的进展

TL;DR数据的指数增长引发了对机器学习研究和工业使用的计算需求。深度神经网络的稀疏化可以创建对复杂数据进行简化的表示。本文提出了一个用于 TensorFlow 的 RadiX-Nets 测试套件,通过测试 RadiX-Net 性能来简化可扩展模型的处理,揭示网络拓扑、初始化和训练行为之间的关系。我们还遇到了训练不一致且准确度较低的 “奇怪模型”,而相似稀疏度的模型则训练良好。