Mar, 2024

基于大型语言模型和图结构理解的细粒度合成流数据对抗数据稀疏

TL;DR提出了一种细粒度的流式数据综合框架,将稀疏用户分类为中尾、长尾和极端用户,并设计了 LLMs 来全面理解流式数据中的三个关键图元素,包括局部 - 全局图理解、二阶关系提取和产品属性理解,从而生成高质量的合成数据以有效应对不同类别的稀疏性。实验结果表明,在三个真实数据集上,通过合成数据显著提高了性能,MSE 分别减少了 45.85%,3.16%和 62.21%。