关键词instruction tuning data
搜索结果 - 3
- TextSquare:文本为中心的视觉指令调优的扩展
TextSquare 通过使用 Square-10M 数据集,远远超过开源模型,提出了对文本中心的 MLLMs 进行调参的新方法,并在 OCR 评估中达到了新的标准 (62.2%),同时在 6 个文本中心基准测试中胜过 GPT4V 和 Ge - 聚类和排名:通过专家对齐质量估计实现保留多样性的指令选择
使用 Clustering and Ranking (CaR) 方法,根据专家偏好选择高质量的指导数据,通过提供数据集多样性来确保高质量数据选择,实验结果表明,CaR 方法仅使用 1.96% 的 Alpaca 的 IT 数据子集,训练的 A - 为指导调整的大型语言模型添加虚拟提示注入
我们提出了虚拟提示注入(VPI)技术,用于调整指令的大型语言模型(LLM)。VPI 允许攻击者指定虚拟提示,在特定触发场景下引导模型行为,而无需显式地注入模型输入。我们通过污染模型的指令调整数据,演示了 VPI 的风险,并建议采用数据过滤作