Apr, 2024

KoCoNovel:韩国小说中的人物指代注释数据集

TL;DR《KoCoNovel》是一项基于韩国文学文本的创新性人物共参考数据集,从 50 部现代和当代韩国小说中提取的 178K 令牌构成,是继 NIKL 语料库之后韩国第二大公开的人物共参考解析语料库,并且是首个基于文学文本的语料库。该数据集提供四个不同版本的 KoCoNovel,为包括全知作者和读者视角以及单独或重叠处理多个实体的选项提供了选择。实验证明,使用 KoCoNovel 与 NIKL 语料库相比,基于 BERT 的人物共参考模型表现出明显的性能提升,这一发现凸显了 KoCoNovel 通过整合韩国文化和语言动态的潜力,可以显著增强人物共参考解析模型。