Feb, 2024

你的视觉语言模型本身就是一个强大的过滤器:走向高质量的指令调优与数据选择

TL;DR通过将自己作为过滤器,利用训练后的评分网络来衡量每个指令的难度,并选择最具挑战性的样本,自过滤方法可以在仅使用约 15% 的样本的情况下达到比全数据设置更好的结果,并取得优于竞争基线的性能。