May, 2024

GPT 对您的数据价值是多少?使用影响函数的 LLM 规模数据估值

TL;DR本研究提出了一种高效的梯度投影策略 LoGra,改进了影响函数的可扩展性,进而提出了数据价值评估的理论动机,并通过引入 LogIX 软件包,降低了实施数据价值评估系统的门槛。实验证明,LoGra 在保持竞争准确性的同时,吞吐量提升了 6500 倍,并且 GPU 内存使用降低了 5 倍。