May, 2024

HuixiangDou-CR:群聊中的共指消解

TL;DR如何消除群聊中的代词引用?本文通过预处理58k条真实聊天数据并手动标注2.3k个问题,验证了该标注的可靠性;然后对从0.5B到32B参数范围内的Qwen模型进行微调,最佳版本F1得分提高了29.07,确认了利用大型语言模型(LLM)进行下游自然语言处理(NLP)任务的可行性;我们的贡献是:1)创建了以alpaca格式的有监督微调(SFT)训练数据,包括一组低秩适应(LoRA)权重;2)开发了一种基于缩放定律原理获取高质量数据的方法;脚本、以alpaca格式的原始数据和实验跟踪已在Github、HuggingFace和WandB上开源;数据隐私经用户授权。