Jan, 2025

RAG-WM:一种高效的黑箱水印方法用于大语言模型的检索增强生成

TL;DR本研究针对当前检索增强生成(RAG)技术在知识产权侵犯检测中的不足,提出了一种新型的黑箱“知识水印”方法RAG-WM。该方法通过多模型交互框架生成并注入水印文本,实验结果表明,RAG-WM能够有效检测在多种大语言模型中被盗用的RAG,同时具备对抗多种攻击的鲁棒性,具有重要的知识产权保护潜力。