interpretable features | BriefGPT

关键词interpretable features

搜索结果 - 17

InceptionV1 早期视觉中缺失的曲线检测器：应用稀疏自编码器
应用稀疏自编码器 (SAEs) 于卷积神经网络的早期视觉层，发现 SAEs 可以揭示从单个神经元中难以察觉的新的可解释特征，包括填补之前空白的额外曲线检测器，并将一些多义性神经元分解为更具单一语义的组成要素，这些发现表明 SAEs 是理解
PDFa month ago
稀疏自编码器的扩展和评估
稀疏自编码器通过重构来自稀疏瓶颈层的激活，提供了一种从语言模型中提取可解释特征的有前途的无监督方法。我们提出使用 k - 稀疏自编码器来直接控制稀疏性，简化调整并改进重构 - 稀疏性的界限，并引入一些评估特征质量的新度量标准，这些度量标准在
PDFa month ago
通过门控稀疏自编码器改进字典学习
通过引入 Gated Sparse Autoencoder，文章解决了稀疏自编码器中的估计偏差问题，实现了对语言模型激活的解释性特征的无监督发现。
PDF2 months ago
朝着可解释的自动神经解剖学
我们提出了一种新的方法来量化脑组织的微观结构，该方法基于对细胞形状进行分析得到的可解释特征的自动识别。与传统方法相比，我们的系统基于可解释特征而不是灰度值来做决策，并且可以准确地定位和识别现有的脑结构，从而有助于连接组学研究和脑电路的逆向工
PDF3 months ago
ICLR非负对比学习
通过非负对比学习（NCL），我们提出非负矩阵分解（NMF）的新应用，旨在提取可解释的特征，在数学上与 NMF 目标保持一致，不仅在特征区分度、特征选择方面表现出众，而且在下游分类任务中表现优异。
PDF4 months ago
AAAIQ-SENN：量化自解释神经网络
计算机视觉中的解释通常是需要的，但大多数深度神经网络只能提供有问题的准确性的显著性图。自说明神经网络（SENN）提取可解释的概念，并将它们线性组合用于决策。我们提出了量化自说明神经网络 Q-SENN，它能够满足或超越 SENN 的期望，并适
PDF7 months ago
可识别的对比学习与自动特征重要性发现
本文介绍了一种新的三因素对比学习方法（triCL），通过引入一个可学习的对角矩阵 S，使得得到的特征不仅具有可识别性，而且可以按重要性矩阵 S 的顺序进行解释，从而提高了对比学习的能力。
PDF8 months ago
在人工和生物神经系统中识别可解释的视觉特征
在神经网络中，单个神经元往往是 “可解释的”，因为它们代表了个别直观有意义的特征。然而，许多神经元表现出混合选择性，即它们代表多个不相关的特征。最近的假设提出深度网络中的特征可能通过多个神经元以非正交的方式进行 “叠加”，因为自然数据中可解
PDF9 months ago
深度神经网络在头颈癌预测中的特征梯度流解释
该研究介绍了一种名为特征梯度流的新技术，用于以人类可以理解的特征来解释深度学习模型。该技术通过测量可解释特征与模型的梯度流之间的一致性来评估特定特征对模型的重要性，并通过在损失函数中添加正则项来训练更易解释的神经网络。研究还在从癌症影像存档
PDFa year ago
ACLSenteCon：利用词库学习人类可解释的语言表示
本研究提出了 SenteCon 方法，该方法将文本编码为可解释性类别，从而在保持特征性能的同时提高深度语言表示的可解释性。实验证明，SenteCon 编码语言提供高水平的可解释性，并在下游任务的预测性能方面优于现有的可解释性语言表示。
PDFa year ago
使用单个预测解释的特征构建
提出了一种可解释的特征构造 (EFC) 方法，该方法通过聚合实例解释的预测模型，识别了 IME 和 SHAP 等流行解释方法所揭示的共同属性组，并使用逻辑，关系，笛卡尔，数字，阈值 num-of-N 和 X-of-N 构造算子，将搜索空间减
PDFa year ago
利用主题和深度变分模型的可解释假新闻检测
本研究开发了一个深度概率模型，该模型使用一个变分自动编码器和双向 LSTM 网络的密集文本表示与从贝叶斯混合模型中推断出的语义主题相关特征，旨在使用可解释的特征和方法检测真假新闻，实验证明该方法实现了与现有方法可比较的性能。
PDF2 years ago
新闻文章中的可解释宣传检测
为了应对每天都暴露在误导性和宣传性新闻文章和媒体帖子中的在线用户，我们提出了一种检测和展示这些技术的方法，以提供可解释性。特别地，我们定义了定性描述性特征，并分析了它们检测欺骗技术的适用性，同时表明我们的可解释性特征可以与预训练语言模型轻松
PDF3 years ago
ICLR关于具有感知对齐梯度的模型的优点
本文研究了在对抗训练中利用最大扰动界限限制来获得可解释的、感知对齐特征，并证明这种方法可以提高零样本和弱监督定位任务的性能。
PDF4 years ago
KDDKiloGrams：用于恶意软件分类的大型 N-Grams
本篇论文提出了一种快速找出 top-k 频繁 n-gram 的方法，并演示了即便在 n 的规模极大时，n-gram 仍然具有分类预测的能力，同时可用于创建工业标准工具如 Yara 兼容的通用签名特征，且公共 ngram 文件的数量可用于训练
PDF5 years ago
可解释的集合函数
研究了使用深度格网网络模型进行变长置换不变的特征向量聚合来预测标签，并添加输入和输出之间的单调性约束以提高可解释性。同时使用所提出的集合函数来从稀疏分类特征中自动化工程密集且可解释的特征，称为语义特征引擎。在实际数据上的实验表明，其准确性类
PDF6 years ago
NIPS基于图卷积网络的分子指纹学习
本文介绍了一种可直接在图形上操作的卷积神经网络，其架构推广了基于圆形指纹的标准分子特征提取方法，说明这些数据驱动的特征更易解释，并且在多种任务上具有更好的预测性能。
PDF9 years ago