Apr, 2022

实体、日期和语言:使用 T0 进行历史文本的零样本学习

TL;DR本文探讨了使用 T0 模型的 zero-shot 技术来进行跨越时间和语言的 NER 是否可行,通过历史文献的测试,结果表明利用 prompt 的 naive 方法在 zero-shot 多语种 NER 方面存在误差,但揭示了该方法在缺乏标记数据的历史语言方面的潜力。此外,实验结果也表明类似 T0 的模型可以用于预测文档的发布日期和语言,这对于历史文本研究非常有意义。