COLINGMar, 2024
使用维基百科超链接自动构建大规模地理解析语料库
Automatic Construction of a Large-Scale Corpus for Geoparsing Using Wikipedia Hyperlinks
Keyaki Ohno, Hirotaka Kameko, Keisuke Shirai, Taichi Nishimura, Shinsuke Mori
TL;DR通过使用维基百科文章中的超链接将多个位置表达式与坐标关联起来,我们构建了 WHLL(Wikipedia Hyperlink-based Location Linking)语料库,该语料库包含 130 万篇文章,每篇文章大约包含 7.8 个独特的位置表达式。实验结果表明,通过消除位置表达式的歧义性,仍然存在改进的空间。