ACLMar, 2024
WaterJudge:在为大语言模型加水印时实现质量检测与权衡
WaterJudge: Quality-Detection Trade-off when Watermarking Large Language Models
Piotr Molenda, Adian Liusie, Mark J. F. Gales
TL;DR通过比较评估的灵活自然语言生成评估框架,本研究提出了一个简单的分析框架,用于评估特定水印设置引起的生成文本质量降低,以找到平衡性能和易检测性的最佳水印操作点。该方法应用于两个不同的摘要系统和一个翻译系统,实现了任务内和跨任务的模型分析。