Jan, 2023

避免恶意解释:使用STEALTH

TL;DRSTEALTH是一种方法,通过递归双向聚类数据并向AI模型询问关于类别标签的有限数量的查询来避免恶意攻击和不公平问题。