May, 2023

步行游记数据集

TL;DR我们构建了 Arukikata 旅行游记数据集并免费提供供学术研究使用。该数据集拥有超过 3100 万字的日文文本,包括 4672 篇国内和 9607 篇海外游记文章。这个数据集的建立解决了旅行游记数据稀缺的问题,以便对旅行游记的研究具有公平性和可重复性,并促进旅游业的发展。