Nov, 2023

一种语言及其维度:语言分形结构的内在维度

TL;DR该研究介绍了一种新的研究对象 - 语言分形结构,假设一个自然语言的所有 n-gram 嵌入构成了该分形集合的代表样本,通过使用基于拓扑数据分析和数据图的最小生成树方法估计俄语和英语语言分形结构的固有维度,结果发现对于俄语和英语语言,所有的 n 值的固有维度都是接近 9 的非整数值(典型的分形集合)。