BriefGPT.xyz
Ask
alpha
关键词
feature attribution explanation
搜索结果 - 3
水印技术特征归属的无害和多位模型所有权验证
模型版权的关键问题是所有权验证和水印技术,目前的基于后期方法是通过检查是否具有特定属性来识别可疑的第三方模型是否被盗窃。本文提出了一种新的基于可解释人工智能的水印技术,通过嵌入特征归属的解释中的验证行为来解决现有方法的限制。
PDF
2 months ago
机器学习中的程序公正
机器学习中的公平性问题引起了广泛关注,然而现有研究主要关注模型的分配公平性,而忽视了程序公平性。本文首先定义了机器学习模型的程序公平性,然后给出了个体和群体程序公平性的形式化定义,提出了一种用于评估机器学习模型群体程序公平性的新指标 $GP
→
PDF
3 months ago
大型语言模型能否自我解释?LLM 生成自解释的研究
ChatGPT 的自解释性能与传统方法相媲美,在成本较低的情况下,且具有许多有趣的特性,促使我们重新思考当前在 ChatGPT(类似的 LLM)时代的模型可解释性实践。
PDF
9 months ago
Prev
Next