InvVis:用于可逆可视化的大规模数据嵌入
我们提出了一种逆向识别方法 (INVERT),通过利用学习表示与人可理解的概念之间的区分能力,实现了将学习表示与其对应解释相连接的可扩展方法。此方法具有较低的计算复杂度并且不依赖于分割掩码的可用性,还提供了一个可解释的度量来评估表示与其相应解释之间的一致性并提供统计显著性的度量值,强调其实用性和可信度。我们展示了 INVERT 在各种场景中的适用性,包括识别受偶然相关性影响的表示以及对模型中决策层次结构的解释。
Nov, 2023
本文提出了一种基于可逆神经网络(INNs)的 Invertible Encoding Network 方法来构建更好的图像空间和潜在特征空间之间的转换,并在 Kodak、CLIC 和 Tecnick 数据集上证明了该方法在高分辨率图像方面优于现有的学习图像压缩方法和压缩标准(包括 VVC (VTM 12.1))的实验结果。
Aug, 2021
利用预训练的文本图像模型通过 DDIM 图像反转提取 ID 图像的传播域表示,不需要额外的图像编码器,然后通过精心设计的轻量级注意力适配器将提取的 ID 提示特征和文本图像模型的中间特征有效地嵌入到基础文本图像模型中,从而为 ID 定制生成和模型规模上提出的 Inv-Adapter 在 ID 忠实度、生成忠诚度、速度和训练参数等方面进行了广泛的实验评估表明其具有很高的竞争力。
Jun, 2024
本文提出了一种基于拓扑数据分析的可扩展点云数据可视化技术 ——ShapeVis,通过构建数据流形上的加权见证图和从标准社区检测算法中引入的感应映射来压缩表示点云特征,并使用模块化方法剪枝和重建图形以总结数据的形状。与 Mapper 方法相比,我们的算法可以适用于成百万点数据的可视化展示。
Jan, 2020
Embedding Projector 是一种交互式的嵌入可视化和解释工具,该工具可用于分析和探索嵌入的属性和特点,主要应用于机器学习、NLP 等领域。
Nov, 2016
本文提出了一种叫做 LargeVis 的技术,旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比,LargeVis 构建精确近似的 K 最近邻图的计算成本更低,并采用了一个原则上的概率模型来进行可视化,整个过程易于扩展到数百万个高维数据点。实验结果表明,LargeVis 在效率和效果方面均优于现有的先进方法。
Feb, 2016
本文介绍了一种大容量和灵活的视频隐写网络 (LF-VSN),提出了一种可逆的管道,可以通过单个神经网络隐藏 / 恢复多个秘密视频,还介绍了一种可控密钥方案,使不同的接收者能够从相同的覆盖视频中恢复特定的秘密视频。同时,为多个视频隐藏提供了可伸缩策略,可以通过单个模型和单个训练会话在覆盖视频中隐藏不同数量的秘密视频。经过广泛的实验证明,在视频隐写性能显著提高的同时,我们提出的 LF-VSN 具有高安全性,大隐藏容量和灵活性。
Apr, 2023
提出了可逆解释网络,可以透明地应用于现有的神经网络架构,将原始表示转换为等效但可解释的表示,并通过仅草绘两个图像和无监督策略定义语义概念,以解释图像生成网络的分类和生成。
Apr, 2020
基于 T2I 扩散模型,本研究提出了一种局部感知反演(LocInv)方法,通过利用分割地图或边界框作为额外的定位先验,精确修正扩散过程中的交互关注图,使其与文本提示中的正确名词和形容词单词紧密对齐,从而实现对特定对象的细粒度图像编辑,并防止对其他区域产生不希望的改变。该方法在 COCO 数据集的子集上经过广泛评估,定量和定性地都取得了优秀的结果。
May, 2024