- CCA 在多视角文本数据中生成潜在状态 / 变量的适用性
本研究展示了典型相关分析 (CCA) 在发现在双视图设置下捕捉文本数据中的上下文信息的潜在状态方面的潜力,并提出了使用 CCA 执行自动短答案评分任务的模型。经验证实,该模型在实践分析中取得了有竞争力的结果,甚至可以胜过各种先进的监督技术。 - 基于超图的自监督学习与高效采样信号
SE-HSSL 是一个基于超图的自我监督学习框架,通过两个无需采样的目标和一个基于层次关系的对比目标来解决超图自我监督学习模型中的负样本采样偏差和计算效率问题。实验证明,与现有方法相比,SE-HSSL 在有效性和效率上都具有优势。
- 学习在新环境中行走:用于 c-VEP BCI 的无校准解码
该研究探讨了两种零训练方法,旨在通过消除校准过程提高脑 - 机接口(BCI)的可用性。研究引入了一种以事件相关电位(ERP)为基础的新方法,无监督均值最大化(UMM),应用于快速编码调制视觉诱发电位(c-VEP)刺激协议中。通过与使用典型相 - 基于多特征和 t-SNE 的非线性规范相关分析进行土地覆盖图像的半监督分割
提出一种新的半监督图像分割方法,利用径向基函数和经典相关分析算法,通过对少量标记数据进行训练,提取图像的规则变量,并应用 k 均值聚类算法进行分割。
- 深度广义典型相关分析再探
探索多个观测随机向量之间的潜在共变性的经典统计方法 —— 典型相关分析 (CCA) 以及其扩展和变化在发现多视图数据集中的共同随机因素方面的能力。该研究设计了一种新颖高效的模型,适用于典型相关分析的深度扩展,并克服了现有方法的局限性,将私有 - 多组学数据中基于综合内外数据集关系的癌症亚型鉴定
该研究提出了一种新颖的方法,通过融合多组学数据实现对癌症亚型的识别。所提出的方法名为 LIDAF,利用基于不同组学数据之间和内部的线性关系的亲和矩阵(线性组间和组内数据亲和融合)进行聚类。该方法通过使用经典相关分析基于欧氏距离生成距离矩阵, - 朝着对齐的规范相关分析的初步构想和概念验证结果
提出了一种新的框架 Aligned Canonical Correlation Analysis (ACCA),通过迭代地解决对齐和多视角嵌入,解决了多数实际情况中需要的传统方法中不清晰的各种数据视角之间的对齐问题。
- CCA Family 的高效算法:无约束目标与无偏梯度
基于对 CCA 目标的随机梯度下降方法,提出了一种快速的多视图学习算法,能够在大规模数据中同时达到较快的收敛速度和更高的相关性,并能够在生物医学数据集和自我监督学习任务中取得卓越的表现。
- 最大切片互信息
本文提出了一种信息理论的广义 CCA 方法,称为最大切片互信息(mSMI),它通过低维投影识别高维变量之间的最大互信息,能捕捉数据中的复杂依赖关系并具有较快的计算和可扩展的估计能力,同时保留了 Shannon 互信息的优秀结构特性和独立性的 - 公平典型相关分析
该论文研究了正则相关分析(CCA)中的公平性和偏见问题,并提出了一种框架,通过最小化与受保护属性相关的相关差异误差来减轻不公平现象。我们的方法使得 CCA 能够从所有数据点中学习全局投影矩阵,同时确保这些矩阵与特定群体的投影矩阵具有可比性。 - 释放相似性匹配的潜力:可扩展性、监督与预训练
本研究主要介绍了通过 Convolutional Nonnegative SM 和类似于 canonical correlation analysis 的方法来扩大 primarily unsupervised similarity mat - 深度投影网络用于学习时间齐次动力系统
我们考虑时齐动力系统的一般类别,包括离散和连续性,并研究从观测数据中学习状态的有意义表示的问题。这对于学习系统的前向传递算符非常关键,从而可以用于预测未来状态或可观测量。该表示通常通过神经网络参数化,并通过优化类似于规范相关分析(CCA)的 - 自我监督的语音模型对单词的了解程度如何?
本研究发现,不同的自监督语音模型可以在不同的层次编码语言特征,在中间层最大程度地捕获了词级的信息,同时在较高层保留了发音等低层次信息,并用在无额外参数的情况下测试了这些模型的层次表现,同时发现使用 HuBERT 或 WavLM 的最佳表现层 - DCID: 深度规范信息分解
本文提出 DCID 模型以及 ICM 评估指标, 通过实验在已知真实标签的合成数据和大脑 MRI 数据上验证 DCID 模型能够成功提取单变量目标的共享信息,并能更准确地预测大脑区域和肥胖变化。
- 自监督语音模型的分层比较分析
本研究使用基于规范相关性分析(CCA)的轻量级分析工具,考察了多种最近模型的中间表示,发现它们所编码的属性在不同层次上发展,变化与预训练目标的选择有关,进一步探究了这种分析在下游任务中的实用性,并发现 CCA 趋势为选择下游任务感兴趣的层提 - 基于规范相关分析的无线接入网络性能分析框架
该研究旨在基于机器学习和多元分析的诊断方法优化电信网络的性能,通过经典相关性分析法,识别网络中的关键指标及其内部联系,解决数据源的多样性带来的挑战,提高网络规划和配置数据的处理效率。
- 端到端语音识别的神经表示洞察
本文分析了使用 CNN、LSTM 和 Transformer 等网络模型进行端到端自动语音识别模型训练时层之间的内部动态,通过规范相关性分析和中心核对齐,发现 CNN 层内的神经表示随着层深度的增加而表现出层级相关性依赖性,而这种行为在 L - 利用统计检验来建立表示相似性
本文提供了一个框架来验证神经网络的行为,通过功能行为敏感性和特异性等方面测试常用的神经网络模型评估方法,研究发现当前的评估指标存在不同缺陷,一个经典的基线表现出人意料的好,作者对所有指标都无法胜任的场景进行了强调,并为未来的研究提供了挑战性 - 从规范相关分析到自监督图神经网络
本文介绍了一种用于自监督图数据表示学习的概念简单而有效的模型,其通过数据增强生成输入图的两个视图,并通过受经典标准相关分析启发的创新特征级目标进行优化,旨在学习不变表示,并通过不同维度中的相关特性来防止退化解决方案,最终在七个公共图数据集上 - 基于在线黎曼 PCA 的随机规范相关分析
我们提出了一种有效的随机算法(RSG+),使用投影矩阵的重新参数化来进行规范相关分析(CCA),并展示了这种重新参数化如何直接提出机会来重新设计和调整用于 Riemann 流形上数值优化的成熟技术。