利用自编码器进行关联规则挖掘
基于自动编码器的方法可以从时间序列数据中学习和提取关联规则,同时利用语义信息可以促进学习可推广和可解释的关联规则。实验证明,从自动编码器创建的潜在表示中可以提取语义关联规则,并且在许多情况下,该方法的执行时间比现有技术的关联规则挖掘方法快几百倍。这项研究在关联性的提取方法上有推动作用,并有潜力激发更多相关领域的研究。
Mar, 2024
本文通过进行系统化文献综述,提供了从 1996 年到 2022 年发表的 1140 篇学术论文的方法、算法、指标和数据集的深入研究,探讨了数字联想规则挖掘的重要研究问题、现状和未来可能性,并提出了一种新颖的离散化度量来提供与人类分区感知相符的数字数据分区。
Jul, 2023
本研究提出了一种多标签懒惰学习方法,以解决在存在高互相关联的复杂结构标签词汇的大型文档集合中的自动语义索引问题。该方法是传统 k 最近邻算法的演化,它使用经过训练的大型自编码器将大标签空间映射到较小的潜空间,并从该潜空间重新生成预测的标签。我们在 MEDLINE 生物医学文档集的大部分中使用医学主题词(MeSH)词库作为受控词汇对我们的提案进行了评估,实验中我们提出并评估了多种文档表示方法和不同的标签自编码器配置。
Feb, 2024
本文提出了一种基于深度神经网络的模型 Canonical Correlated AutoEncoder(C2AE),在多标签分类任务中通过联合特征和标签嵌入派生一个深度潜在空间,并引入标签相关敏感的损失函数来恢复预测的标签输出,其能够灵活应对多种规模的数据集,与其他现有的多标签分类方法相比表现更加优异。
Jul, 2017
这篇文章介绍了一种新的半监督分类方法,该方法使用监督自编码器网络,将标签编码到自编码器的潜空间,并定义一个结合分类和重构损失的全局准则,用 PyTorch 实现该半监督自编码器方法并展示其在生物医学应用中的卓越表现。
Aug, 2022
本文提出了一种称为 Structuring AutoEncoders 的神经网络,其可以使用弱监督形成结构化的低维空间,从而更有效地表示并分类数据。在基准图像数据集 MNIST、Fashion-MNIST、DeepFashion2 以及 3D 人体形状数据集上进行的实验表明,结构潜空间可以为进一步的分类任务和分类数据的有效选择的操作提供更高效的表征。
Aug, 2019