COLINGMar, 2024

基于高阶特征的稀疏逻辑回归用于从树库中自动提取语法规则

TL;DR我们提出了一种新的方法,从树库中提取和探索显著的细粒度语法模式和潜在的句法语法规则,以创建易于理解的基于语料库的语法描述。我们使用线性分类器提取预测研究中语言现象最显著特征,并将统计信息与每个规则关联,然后将模型结果的排序与其他定量和统计测量结果进行比较。我们的方法捕捉到了西班牙语、法语和沃洛夫语中已知和不太为人知的重要语法规则。