ACLMay, 2023

历史报纸广告的多语言事件抽取

TL;DR这篇研究探讨如何从历史文本中提取事件,并介绍了一个在英语、法语和荷兰语中报导解放奴隶的早期殖民时期报纸广告所组成的新的多语言数据集,作者发现通过将问题描述为提取式 QA 任务,并利用现有的现代语言数据集和模型,即使数据有限,也能实现令人惊讶的好结果;对于历史语言的跨语言低资源学习也具有高度的挑战性,实际上,历史数据集的机器翻译到目标语言经常是最好的解决方案。