May, 2024

Archimedes-AUEB 参与 SemEval-2024 任务 5:LLM 解释民事诉讼程序

TL;DR使用强大的 ChatGPT 模型作为教师模型,通过生成解释和合成数据来扩展训练数据集,并利用生成的数据微调一个小型学生模型。与以往的工作不同,我们的解释不是直接来自教师模型的内部知识,而是基于真实人类分析,从而提供出更优的推理信号。还使用一种新的 “变异” 方法生成受现有数据启发的人工数据实例。我们公开发布这些解释作为原始数据集的扩展,以及用于生成两者的提示。我们的系统在 SemEval 比赛中排名第 15 位。它的性能优于自身教师模型,并且能够生成与原始人类分析一致的解释,经过法律专家验证。