Feb, 2022

语义问答中千万姓名对一百万实体的评估

TL;DR我们介绍了一个语义实体相似度数据集 WES,其中包含 11M 个例子,专注于领域,旨在评估 QA:这些例子是实体和短语,分组为语义聚类以模拟多个 ground-truth 标签,用于预测人类正确性判断的基本交叉编码器度量优于四个经典度量。