May, 2024

利用图书馆学习找出表意文字书写中的结构

TL;DR人类语言的一个特点是组合性 —— 通过重复使用相对较小的基本单元,创建出较为庞大、越发复杂的结构。本文探索了语言中组合性反映了人类对符号系统中表现效率的归纳偏见这一观点。我们使用先进的库学习和程序合成技术,开发了一个计算框架来发现一种写作系统中的结构。计算框架在中国的写作系统中发现了已知的语言结构,并揭示了系统在表现效率的压力下向简化方向演化的过程。我们演示了如何通过利用学到的抽象和压缩的图书馆学习方法,揭示出构成人类认知中组合结构创造的基本计算原则,并对有效沟通系统的演化提供更广泛的见解。