Jan, 2025

为历史土耳其语自然语言处理建立基础资源和模型

TL;DR本研究针对历史土耳其语这一在计算语言学领域中尚未被充分探索的领域,提出了基础资源和模型。研究中首次推出了历史土耳其语命名实体识别数据集HisTR和首次建立的Universal Dependencies语法树库OTA-BOUN,以及利用这些数据集训练的变压器模型,显著提高了对历史土耳其语的计算分析能力,为今后的研究提供了基准和契机。