Siamese 神经网络的解释方法

MMNov, 2019

An explanation method for Siamese neural networks

Lev V. Utkin, Maxim S. Kovalev, Ernest M. Kasimov

TL;DR本文提出一种新的解释孪生神经网络的方法，使用嵌入层级别的原型与特征向量进行比较，应用自编码器重构输入数据并在 MNIST 数据集上进行了数值实验。

Abstract

A new method for explaining the siamese neural network is proposed. It uses the following main ideas. First, the explained feature vector is compared with the prototype of the corresponding class computed at the

siamese neural network embedding level prototype autoencoder mnist

发现论文，激发创造

深度学习通过原型进行基于案例的推理：一种解释其预测的神经网络

本文中，我们提出一种新的深度学习网络架构，其中包含自编码器和原型层，这种网络可以自然地解释每个预测的原因，并且能够进行分类。

Oct, 2017

通过 3D 暹罗网络改进文本语义相似性建模

我们提出了一种新颖的 3D 孪生网络模型，用于文本语义相似性建模，通过将语义信息映射到高维空间，保留了更精确的空间和特征领域信息，并为综合下游建模策略提供了必要的结构条件。通过引入多个模块来增强这一 3D 框架，包括特征提取、注意力和特征融合，在四个文本语义相似性基准上的广泛实验证明了我们 3D 孪生网络的有效性和效率。

Jul, 2023

可解释图像相似性：集成孪生网络与 Grad-CAM

通过结合孪生网络和 Grad-CAM，提出了一种解释性图像相似度的新框架，为真实世界的图像相似度应用增强了可解释性、可信度和用户接受度。

Oct, 2023

元学习连体网络用于少样本文本分类

本文提出了一种 Meta-Learning Siamese Network 来解决 few-shot learning 中的三个主要问题（即原型向量计算中忽略采样的随机性，忽略标记样本的重要性和纯随机构建元任务）。与现有模型相比，Meta-SN 利用外部知识来编码原型向量，并提出了一种新的抽样策略来构建元任务，同时在六个基准数据集上展示了其明显的优越性。

Feb, 2023

自监督孪生自编码器

本文提出了一种新的自监督方法 SidAE，将 Siamese 结构和去噪自编码器相结合进行无监督预训练，证明其在多个数据集、设定和场景下优于两个自监督对照组，其中关键包括仅有少量标记数据的情况。

Apr, 2023

一种孪生编码器的归因方法

该研究通过将相对于单个输入的集成梯度原理推广到具有多个输入的模型，导出了一种用于 Siamese 编码器的局部归因方法。该方法采用特征对归因的形式，并可简化为用于 sentence transformers 的令牌 - 令牌矩阵。通过关注名词和动词，该方法的初步研究表明，在 ST 中，少数令牌对通常能够解释大部分预测结果。然而，为了准确预测，它需要关注大多数令牌和词性。

Oct, 2023

解释 Siamese 神经网络中的对称性不变量和守恒量

本文在理论物理学领域引入可解释的孪生神经网络 (SNN) 用于相似性检测。具体而言，我们将 SNN 应用于特殊相对论事件、电磁场的变形以及中心势场中粒子的运动，在这些例子中，SNN 学习识别属于同一事件、同一场配置或相同运动轨迹的数据点。结果表明，在学习哪些数据点属于同一事件或场配置的过程中，这些 SNN 还可以学习相关的对称不变量和守恒量。这些 SNN 高度可解释，使我们能够揭示对称不变量和守恒量而无需预先知识。

Mar, 2020

基于修改距离损失的孪生神经网络在语音情感识别中的迁移学习

使用 Siamese 网络进行跨语音情感识别的迁移学习，通过 fine-tuning 和优化 distance loss 可以提高识别准确性。

Jun, 2020

探索简单的同孪表征学习

本文通过研究，展示出使用 Siamese 网络进行图像无监督表示学习的含义，并阐述了在该情况下级联网络的基本角色，并提出了一个新的基于停止梯度的理论，通过实验证明了其正确性。

Nov, 2020

使用自编码器和连体网络进行在线手写签名验证

本文提出了一种新颖的、面向自动签名验证任务的独立于作者的全局特征提取框架，其中包括一个自编码器和一个连体网络来实现样本的建模和分类，利用注意机制和降采样的技术，提高了框架的准确度，其简单性使其计算成本低，并且可以在 GPU、TPU 等设备上并行使用。在两个数据集上的实验表明，该方法相对于最佳报告结果取得了显著的准确度提高。

Dec, 2017