Jul, 2024

MUSE: 机器卸载六方面评估用于语言模型

TL;DR利用MUSE标准来综合评估了八个七十亿参数的语言模型在删除哈利·波特书籍和新闻文章的过程中,发现现有的算法在阻止严重的隐私泄露方面有限,对模型的技术功用造成退化,并且不能持续支持连续的取消学习请求或大规模内容删除。