- 用本质维度估计来鲁棒性探测人工智能生成的文本
研究了人类文字的固有维度不变性问题,通过计算给定文本样本嵌入集合的固有维度,可以稳健地区分自然语言流畅文本和 AI 生成文本。而且该特性可以用来构建一个得分为基础的人工文本检测器。
- PastNet: 引入物理归纳偏置以进行时空视频预测
本文介绍了一种基于物理辅助的时空网络(PastNet)的方法,该方法通过将谱卷积运算引入傅里叶域,有效地引入潜在物理定律的归纳偏差,并使用估计的内在维度的存储器库来离散化本地功能以降低计算成本和促进高分辨率视频预测。与现有的方法相比,Pas - 通过鲁棒性选择特征以应对维度灾难
提出了一种新方法,该方法根据内在维度的计算,选择可区分数据子集的特征,有助于降低高维度和特征选择的困扰。实验证明该方法优于传统方法,并可在含数百万个数据点的数据集上应用。
- Scikit-dimension: 用于内在维度估计的 Python 包
本文介绍了一种开源 Python 包 —— scikit-dimension,用于推断固有维数,并提供了该包在实际数据和人工数据的大规模基准测试结果。
- ICML分层解缠的基准、算法和指标
本文介绍了用于学习具有层次结构表示的权威因素的基准、算法和指标,解决了代表学习中处理多种组合的上下文相关性、不确定性等实际生产过程的挑战。
- 基于测度集中的本地内在维度估计器
本文介绍了基于线性可分性的本地 ID 估算器,并与其他利用测量集中各种效应引入的 ID 估算器进行比较并研究其属性。观察到的估算器之间的差异可用于预期它们在实际应用中的行为。
- 深度神经网络中的降维压缩和扩展
本研究发现神经网络可以学习较低维度的流形,从而在高维数据空间中分解数据,同时又能取得良好的泛化性能,重点关注降维和流形的内在维度等方面。
- 深度神经网络中数据表示的内在维度
研究了深度神经网络的几何属性和数据表示的内在维度,发现最后一个隐藏层的内在维度预测测试集合的分类准确性,这证明了可以广泛应用的神经网络是将数据转换为低维非线性流形的网络。
- ICLR使用交叉本地内在维度评估 GAN 的质量
本文提出了一种基于 GAN 模型学习的数据空间的内在维度特征来评估 GAN 生成数据能力的方法,同时提出了一种新的评估度量 CrossLID,并通过在 4 个基准图像数据集上的实验表明,与其他现有的评价指标相比,CrossLID 更加敏锐, - CVPR图像表示的内在维度
本文研究了图像表示的内在维度,提出了一种基于深度神经网络的非线性映射算法 DeepMDS,并通过图像匹配验证了其映射的正确性。实验结果表明,在 LFW、IJB-C 和 ImageNet-100 等基准数据集上,深度神经网络表示的内在维度显著 - NIPS针对深度学习动态和可解释性的奇异向量正则相关分析(SVCCA)
提出了 Singular Vector Canonical Correlation Analysis(SVCCA)技术,用于快速比较两个表示方式,并测量网络层的内在维度、学习动态、类特定信息和建议新的训练方案。
- ICML基于优先的 DCI 的快速 k 近邻搜索
该研究介绍了一种名为优先的动态连续索引(Prioritized DCI)的变体,用于 k 近邻搜索,并且相对于现有方法(如局部敏感哈希,LSH),优先 DCI 通过线性增加空间而不是查询时间的依赖来解决了维数灾难的问题,并在内在维数方面展现 - 零偏置自编码器及联合适应特征的优势
使用隐藏层作为选择机制以确保表示的稀疏性导致隐藏单元偏差取负值,提出了一个新的解耦激活函数来解决这个问题,可以学习高固有维度数据的表示。
- 通过随机嵌入在十亿维度上进行贝叶斯优化
本文介绍了 Random Embedding Bayesian Optimization (REMBO) 算法,运用随机嵌入思想来攻克高维度问题,此算法简单且具有重要的不变性,应用于具有连续和分类变量的领域,经理论和实证分析证明 REMBO - 用主成分分析估计数据的内在维度
本文介绍了一种基于 PCA 的新方法,用于估计具有非线性结构的数据的内在维数,该方法利用整个数据集估计其内在维数,并方便增量学习。该方法使用数据的最小覆盖来处理数据集的非线性结构,并通过检查所有小邻域区域的数据方差来确定估计结果。实验结果表