适用于多重图案布局分解的 GPU 加速矩阵覆盖算法
使用联合投影学习与张量分解的方法(JPLTD)解决了不完整多视图聚类(IMVC)中的问题,包括高维特征冗余和噪声、图的噪声以及丢失样本引起的图噪声,并通过 JPLTD 模型的优化算法取得了优于现有方法的实验结果。
Oct, 2023
本文介绍了一种基于因素的模式分解框架 CombiFD 以及一种新的模式分解算法 AMIQO,通过 Quadratic Programs 序列解决大量复杂的背景知识,并在材料发现等领域中得出了显著的结果。
Nov, 2014
本文介绍了一种新的基于双重块升降法的 MAP-solver, 叫做 MPLP++, 具有比现有的解算器 TRWS 更显著的性能提升,并具有高度并行性,可用于计算机视觉、生物影像等领域。作者使用公开的基准测试和对象位姿问题验证了这种算法的卓越性能,并提供了关于图密度的消融研究。
Apr, 2020
提出了一种基于量子多体物理中的矩阵积算符(简称 MPO)的新型预训练语言模型压缩方法,其可以将原始的矩阵分解成中心张量和辅助张量,通过仅更新辅助张量的参数进行微调并为 MPO 结构设计优化算法,可应用于原始或压缩的语言模型以实现更轻量级的网络和显著减少微调参数。
Jun, 2021
提出了一种基于深度矩阵分解与分割对齐的新型多视角聚类算法,全面利用各视角的分区表示并融合多视角信息,通过交替优化算法解决优化问题,实验结果表明该算法在六个多视角数据集中优于目前的方法。
May, 2021
本文提出一种基于 MPO 分解的高度参数化效率的方法,可将预训练语言模型(PLMs)扩展到更深的模型深度,并通过共享主要信息和保留层特定辅助信息的组合,实现模型大小的降低和性能提升。
Mar, 2023
这篇论文展示了硬件和软件的协同设计如何为特定的大型语言模型工作负载创建定制的硬件系统,通过模型并行技术和多加速器仿真框架实现效率度量,重点关注推理工作负载并报告多种软硬件配置下的功耗、周期和延迟度量。
Dec, 2023
本研究利用物理规范化深度自监督学习结构,加速针对集成电路的 ptycho-laminographic 重建,仅需采集 16 倍少的角度样本和 4.67 倍更快的计算,且重建品质优于完整采集和无学习的密采集重建,从而实现了对纳米结构的三维检查,并为安全和可靠性保障做出了贡献。
Apr, 2023
本论文介绍了一种新的针对深度神经网络(DNN)硬件加速器的优化框架,它能够快速开发定制化和自动化的设计流程,同时具有高度可定制性和灵活性,通过引入新的优化和转换任务,不需要人类专业知识,可以在保持准确性的同时大幅度降低 DSP 和 LUT 使用,相较于现有技术,具有更高的精度和更少的 DSP 资源使用率。
Jun, 2023