Jun, 2024

STARD:一个包括非专业人员发出的真实查询的中文法规检索数据集

TL;DR为了填补现有法律查询数据集对非专业用户提出的实际查询的不足,本文引入了 STAtute Retrieval Dataset(STARD),该数据集由 1543 个来自现实世界法律咨询的查询案例和 55348 个候选法规文章组成,并通过对各种检索基线模型进行综合评估,揭示了现有检索方法在非专业用户提交的实际查询中的不足,为进一步探索和研究提供了必要性。