Jun, 2023
穿越数个世纪的迁移学习:机器和历史学家集成方法解密王室秘书日记
Transfer Learning across Several Centuries: Machine and Historian Integrated Method to Decipher Royal Secretary's Diary
Sojung Lucia Kim, Taehong Jang, Joonmo Ahn, Hyungil Lee, Jaehyuk Lee
TL;DR该研究介绍了朝鲜历史文献中的命名实体识别和分类,通过将语言模型调整到历史文献上,与使用预训练的多语言模型进行对比实验,发现短语标记明显改善了 NER 模型在预测不同时间段撰写的未见过的实体时的性能。