Mar, 2025

一种信息论方法识别文本数据中的公式群集

TL;DR本研究解决了在历史文献中识别公式性群集的挑战,特别是在多作者文本如希伯来圣经中的应用。通过提出一种基于信息论的算法,该方法利用加权自信息分布来检测文本中的结构性模式,成功地孤立了风格层,为文本的分层分析提供了量化框架。这一创新方法加强了我们分析复杂作者和编辑过程塑造的文本的能力。