关键词mathematical properties
搜索结果 - 6
- 隐蔽的洞:语言模型的拓扑学问题
通过研究基于原始文本数据训练的自回归神经语言模型中出现的表示流形的拓扑属性,我们引入计算代数拓扑学的工具,使用其作为拓扑复杂度的度量标准(称为穿孔),以研究 GPT 的拓扑结构随深度和时间的演变,与门控循环模型进行比较,发现门控循环模型表现 - STL:一种用于神经网络的带符号和截断的对数激活函数
本文介绍了一种新的符号截断对数函数作为激活函数,它具有明显更好的数学性质,如奇函数、单调性、可微性、具有无界值范围以及连续非零梯度,因此成为激活函数的卓越选择。通过与其他知名激活函数在几个著名神经网络上的比较,结果证实该函数为最先进的。该建 - 非可加测度的运输问题
在此工作中,我们解决了定义非可加测度的最优传输问题的问题,并提供了绕过此问题的解决方案,包括 Möbius 变换和 $(\max,+)$- 变换。我们还提供了最优传输问题的定义和证明了一些性质。
- 混沌作为可解释的预测和数据驱动建模基准
该论文介绍了一个包含 131 个已知的混沌动力系统的数据库,每个系统都与预计算的多变量和单变量时间序列相匹配,这些系统涵盖了天体物理学,气象学和生物化学等领域,并对每个系统的已知数学属性进行了注释,并通过多种方式使用该数据库进行了实验。
- 利用环结构网络学习高效张量表示
提出一种称为张量环表示的新型张量分解的网络结构,该结构采用低阶核张量的循环多线性乘积,通过低秩近似的方法来有效地学习张量环表示,可以在计算上更有效地执行基本操作,并且通过与现有的张量列网络相比实验结果表明,该模型更具表达能力和一致性信息。
- 通过测量等变性和等价性来理解图像表示
本文探讨了图像表示的数学属性,如同变性,不变性和等价性等,提出了多种方法来实现这些属性,并应用到流行的表示中来揭示其结构的有益方面。