- MM深度生成建模改善压缩与传输:从效率到可靠性
信息论和机器学习密不可分,而深度生成模型则在数据压缩和传输误差修正方面起着重要作用,本文介绍了深度生成模型在数据压缩和错误修复中的双重功能,并强调了生成人工智能与源码和信道编码技术的重要联系。
- 点云压缩框架:智能交通系统中路侧激光雷达的点云压缩
面向道路激光雷达的点云压缩方法 PointCompress3D,实现了高效的数据存储、流媒体传输和实时物体检测,优化了压缩性能并保持与原始数据的准确性和兼容性。
- 轻量级概念词典学习在文本分类中的应用
我们提出了一种新颖的轻量级监督字典学习框架,用于基于数据压缩和表示的文本分类。该算法通过 LZW 算法从文本数据集构建字典,优化字典元素并考虑标签数据,生成区分性数值表示,以便训练 SVM 和神经网络等简单分类器。我们通过信息瓶颈原理进行信 - 了解机器学习训练集中无损压缩的有效性
对机器学习和人工智能在高性能计算中的应用,数据压缩对模型质量的影响以及现代有损压缩方法的优势进行了系统评估,指出了指导将来使用和设计有损压缩器的关键见解。
- 连续点位波测量与生成型人工智能进行的电网监测和保护
本文提出了一种基于生成式人工智能(AI)、机器学习和统计推断的新一代电网监控和控制系统,借助最新技术进展,在监控和控制范畴超越了基于监控控制和数据采集(SCADA)及同步相量技术的早期系统,我们通过联络连续或逐点测量数据库(CPOW)流数据 - 构建最优的语言模型学习
通过最大化数据压缩比率,优化语言模型的学习,提出了一个理论来揭示在此目标下优化学习过程的动态特性,并通过实验验证了该理论的有效性,最终得出语言模型的最优学习实质上是通过改善语言模型的缩放定律系数来实现的,为设计实用的学习加速方法提供了巨大的 - 结构化数据的自动编码器压缩:非线性和深度的可证明优势
对于 1 位稀疏高斯数据压缩的典型情况,我们证明梯度下降收敛到一个完全忽略输入稀疏结构的解,且相对于高斯源完全没有稀疏性能。对于一般数据分布,我们提供了关于梯度下降最小化器形状的相变现象的证据,关键是数据的稀疏度:在关键稀疏性水平以下,最小 - 通过数据压缩评估大型语言模型的泛化能力和鲁棒性
我们提出了一种基于无损数据压缩的评估方法,用于测试模型训练截断后的预测能力广义化情况。我们收集了从 2017 年到 2023 年的 83 个月的全面测试数据,并根据模型的训练数据截断将数据分为训练和测试期。我们通过测试期的压缩性能作为对未见 - MGARD:用于高性能、误差控制的数据压缩和重构的多格框架
MGARD 是一种提供了针对结构化和非结构化网格上的浮点科学数据的多网格自适应降维的软件,具有出色的数据压缩能力和精确的误差控制,可用于存储减少、高性能输入 / 输出和原位数据分析。它采用统一的应用程序编程接口 (API),可以在不同的计算 - 基于变分自动编码器的深度学习技术用于填补反应 PIV 数据中的空缺
使用基于深度学习的条件变分自编码器 (CVAE) 技术填补燃烧系统中常见的粒子图像测速 (PIV) 测量中的空白,通过时间分辨率的可观测商业相关燃烧器中的缺失 PIV 场进行训练,通过对三组燃烧器操作条件数据集的重建速度场评估不同误差指标来 - 混合专家隐式神经压缩模型
用深度神经网络中参数对数据进行压缩的隐式神经表示(INR)是一种有前景的数据压缩技术,提出了一种基于专家组混合理论的新型隐式神经压缩方法 MoEC,通过自动分配 INR 给场景中的 3D 点,可以自适应地找到最佳分区并在海量多样的生物医学数 - 通过稀疏率减少实现的白盒变压器:压缩无外乎此
我们认为表示学习的自然目标是将数据的分布压缩和转换为支持在不相关子空间上的低维高斯混合模型。我们通过基于名为稀疏率减少的原则性度量评估这种表示的好坏,该度量同时最大化所学表示的内在信息增益和外在稀疏性。从这个角度来看,包括变压器在内的流行深 - 高效的车载深度神经网络处理的低精度浮点数
地球观测、数据压缩、深度学习、量化神经网络、低精度浮点运算
- AccEPT:边缘管道并行训练加速方案
本文提出了 AccEPT,一种用于加速边缘协同流水线 - 并行训练的加速方案,其中包括轻量级自适应延迟预测器以准确估计不同设备上每一层的计算延迟,并通过连续学习适应未见过的设备,以实现更好的模型划分来平衡参与设备上的计算负载。此外,我们还提 - 基于正交基和谱变换的快速机器学习方法
该论文介绍了一种新颖的快速机器学习方法,利用了两种技术:正交基向量嵌入(VEOB)和谱变换(ST)。该方法通过将原始数据编码转换为在正交基向量上投影的向量嵌入,采用奇异值分解(SVD)技术计算向量基和投影坐标,从而在嵌入空间中实现了增强的距 - Mirage:模型无关的图形蒸馏方法用于图形分类
Mirage 是一种用于图分类的无监督和架构无关的蒸馏算法,通过压缩计算数据本身,而不是在原始训练集上模拟梯度流,来提高泛化准确性、数据压缩和蒸馏效率。
- 不要边缘化机制,而应巩固!
结构性因果模型 (SCMs) 是理解许多现实世界系统中的复杂因果关系的有力工具,我们介绍了整合因果机制的概念,以简化大规模 SCM 并保持一致的干预行为。
- 数据效率、降维、广义对称信息瓶颈
对称信息瓶颈(SIB)是一种同时压缩两个随机变量以保留它们的信息的降维技术,我们引入了广义对称信息瓶颈(GSIB),通过探索不同成本函数的形式来研究这种同时降维的代价,同时我们还研究了这种同时压缩的数据集大小要求,结果表明相比于逐个压缩变量 - SymED:自适应和在线边缘数据的符号表示
通过 SymED 方法实现符号化数据在边缘上的在线适应性,达到原始数据平均压缩率 9.5%、较低的动态时间扭曲距离为 13.25、平均每个符号 42ms 的实时适应性,从而减少整体网络流量。
- 宇宙学中的数据压缩和推理:自监督机器学习
自我监督的机器学习方法通过模拟增强构建了大规模数据集的代表性摘要,用于精确和准确的参数推断以及对宇宙学数据的压缩与分析。