Mar, 2023

使用词义消歧解决多词表达识别的问题

TL;DR本文中,我们使用 Bi-encoder 模型训练了一个过滤多词表达式候选人的模型,该模型使用锁定和上下文信息。我们在 DiMSUM 数据集上实现了最优结果,在 PARSEME 1.1 英语数据集上使用此方法获得了有竞争力的结果。同时,我们还尝试使用 Poly-encoder 模型对 MWE 进行识别和 WSD,并引入了一个修改的 Poly-encoder 结构,在这些任务上表现优于标准 Poly-encoder。