Jun, 2024

随机几何代数方法用于凸神经网络

TL;DR我们引入了随机算法到 Clifford 几何代数,将随机线性代数推广到超复向量空间。这种新颖的方法在机器学习中有很多涵义,包括通过凸优化将神经网络训练到全局最优。此外,我们考虑了细调大型语言模型(LLM)中的嵌入作为一个关键应用领域,探索几何代数和现代人工智能技术的交叉点。特别地,我们通过传统方法与基于凸优化的新方法进行了鲁棒的转移学习的比较分析,其中测试了不同嵌入(GPT-4 和 BERT 嵌入)和不同文本分类数据集(IMDb、Amazon Polarity Dataset 和 GLUE)以及一系列超参数设置的凸优化传输学习方法。我们的结果表明,凸优化和几何代数不仅提高了 LLMs 的性能,还提供了一种更稳定和可靠的传输学习方法通过嵌入。