COLINGMar, 2024

一个药物监测的数据集:跨语言标注德语、法语和日语中的不良药物反应

TL;DR通过从患者论坛、社交媒体和临床报告中收集多种语言(德语、法语和日语)关于不良药物反应(ADRs)的文本,本研究提供一个多语言语料库,并提供了涵盖 12 种实体类型、4 种属性类型和 13 种关系类型的注释。该语料库对于发展面向医疗保健的真实世界多语言语言模型具有重要意义。我们提供了统计数据来强调与该语料库相关的某些挑战,并进行了初步实验,实现了在语言内部和跨语言之间提取实体和实体之间的关系的强基线。