May, 2023

Logion:希腊语学领域机器学习

TL;DR利用机器学习方法,我们在希腊文献学领域解决了诸多问题。在使用最大的古希腊数据集训练 BERT 模型后,我们成功鉴别并纠正了文本传承过程中刻写员以往未能发现的错误,同时证明了该模型填补古代手稿材料损伤造成空缺的能力,并与领域专家的表现进行了比较。我们发现,在启发领域专家的模型建议的支持下,最佳表现可得。在考虑到人机协作的同时,我们还探索了模型的可解释性,并发现一些注意力头似乎对古代希腊语的某些语法特征进行了编码。