Apr, 2025
经过认证的最坏情况大型语言模型版权侵犯的缓解
Certified Mitigation of Worst-Case LLM Copyright Infringement
TL;DR本研究解决了大型语言模型在预训练期间暴露于版权材料所引发的潜在版权侵犯问题。提出了一种名为BloomScrub的方法,通过巧妙结合引用检测和改写技术,能够有效识别和处理可能侵犯的内容,从而大幅降低版权侵犯风险。实验结果表明,该方法不仅有效地减少了侵犯风险,而且在不同的执法严格度下保持了实用性,显示出轻量级推理时方法在版权预防中的强大潜力。