MMFeb, 2024

范畴深度学习:架构的代数理论

TL;DR我们提出了一个关于通用框架,用于指定和研究深度学习架构的难题的见解。我们认为目前为止的关键尝试缺乏一个能够将模型必须满足的约束与其实现进行协调的桥梁。我们的提议是应用范畴论 —— 更具体地说,是参数化映射的范畴论,作为一个单一的理论,优雅地包含了这两种类型的神经网络设计。为了支持我们的观点,我们展示了这个理论如何恢复由几何深度学习引起的约束,并介绍了从神经网络的多样化领域中提取的许多架构的实现,如递归神经网络。我们还说明了这个理论如何自然地编码计算机科学和自动机理论中的许多标准结构。