May, 2024

一个百万人的路径:从维基百科提取生活轨迹

TL;DR通过挖掘 Wikipedia 上数百万的人物传记页面,结合 COSMOS 模型的半监督学习和对比学习思想,本研究成功提取了人物生命轨迹,并提供了公开可用的代码、大量提取的轨迹数据和 WikiLifeTrajectory 数据集,以促进轨迹提取研究并帮助构建宏大叙事的分析研究。