Sep, 2023

FRASIMED:基于跨语言 BERT 注释投影的临床法语标注资源

TL;DR通过跨语言注释投射的方法,利用一种语言不可知的基于 BERT 的方法,本研究论文介绍了一种生成翻译版本注释数据集的方法,有效增加低资源语料库的数据量,无需人力投入,只利用已有的开放数据资源。通过对跨语言注释投射方法的评估,证明了该方法的有效性和高准确性。作为该方法的实际应用,本文介绍了一个包含 2051 个合成法语临床案例的法语医疗实体检测注释语料库(FRASIMED),该语料库可供研究人员和从业者在临床领域开发和改进法语自然语言处理应用。