适用于多重图案布局分解的 GPU 加速矩阵覆盖算法

Mar, 2023

适用于多重图案布局分解的 GPU 加速矩阵覆盖算法

GPU-accelerated Matrix Cover Algorithm for Multiple Patterning Layout Decomposition

Guojin Chen, Haoyu Yang, Bei Yu

TL;DR通过将 CPU 数据结构替换为 GPU 并行矩阵运算，提出了一种用于解决多重图案刻蚀技术中面向确切覆盖的布局分解算法的加速方案，实验结果表明，该系统能够实现全尺寸、超快速的布局分解，并且与现有的布局分解方法相比，可以实现超过 10 倍的速度提升而不降低质量。

Abstract

multiple patterning lithography (MPL) is regarded as one of the most promising ways of overcoming the resolution limitations of conventional optical lithography due to the delay of next-generation lithography technology. As the feature size continues to decrease, →

multiple patterning lithography layout decomposition mask layers cpu gpu

发现论文，激发创造

MACH: 快速随机张量分解

本文提出了一种新的采样算法 MACH，用于计算 Tucker 分解，能够有效地处理大规模，计算密集型和后期数据分析的多方面数据。

Sep, 2009

基于联合投影学习和张量分解的不完整多视图聚类

使用联合投影学习与张量分解的方法（JPLTD）解决了不完整多视图聚类（IMVC）中的问题，包括高维特征冗余和噪声、图的噪声以及丢失样本引起的图噪声，并通过 JPLTD 模型的优化算法取得了优于现有方法的实验结果。

Oct, 2023

通过复杂组合约束的模式分解：材料发现应用

本文介绍了一种基于因素的模式分解框架 CombiFD 以及一种新的模式分解算法 AMIQO，通过 Quadratic Programs 序列解决大量复杂的背景知识，并在材料发现等领域中得出了显著的结果。

Nov, 2014

MPLP++：用于稠密图模型的快速、并行双块协同上升算法

本文介绍了一种新的基于双重块升降法的 MAP-solver, 叫做 MPLP++, 具有比现有的解算器 TRWS 更显著的性能提升，并具有高度并行性，可用于计算机视觉、生物影像等领域。作者使用公开的基准测试和对象位姿问题验证了这种算法的卓越性能，并提供了关于图密度的消融研究。

Apr, 2020

基于矩阵积算子的预训练语言模型压缩的轻量级微调

提出了一种基于量子多体物理中的矩阵积算符（简称 MPO）的新型预训练语言模型压缩方法，其可以将原始的矩阵分解成中心张量和辅助张量，通过仅更新辅助张量的参数进行微调并为 MPO 结构设计优化算法，可应用于原始或压缩的语言模型以实现更轻量级的网络和显著减少微调参数。

Jun, 2021

基于深度矩阵因式分解和分区对齐的多视角聚类

提出了一种基于深度矩阵分解与分割对齐的新型多视角聚类算法，全面利用各视角的分区表示并融合多视角信息，通过交替优化算法解决优化问题，实验结果表明该算法在六个多视角数据集中优于目前的方法。

May, 2021

通过参数高效架构扩展预训练语言模型的深度

本文提出一种基于 MPO 分解的高度参数化效率的方法，可将预训练语言模型（PLMs）扩展到更深的模型深度，并通过共享主要信息和保留层特定辅助信息的组合，实现模型大小的降低和性能提升。

Mar, 2023

DEAP：DNN 加速器并行性的设计空间探索

这篇论文展示了硬件和软件的协同设计如何为特定的大型语言模型工作负载创建定制的硬件系统，通过模型并行技术和多加速器仿真框架实现效率度量，重点关注推理工作负载并报告多种软硬件配置下的功耗、周期和延迟度量。

Dec, 2023

三维纳米级集成电路成像的深度自监督 ptycho-laminography 加速技术

本研究利用物理规范化深度自监督学习结构，加速针对集成电路的 ptycho-laminographic 重建，仅需采集 16 倍少的角度样本和 4.67 倍更快的计算，且重建品质优于完整采集和无学习的密采集重建，从而实现了对纳米结构的三维检查，并为安全和可靠性保障做出了贡献。

Apr, 2023

MetaML：用于深度学习加速的可定制跨阶段设计流程自动化

本论文介绍了一种新的针对深度神经网络（DNN）硬件加速器的优化框架，它能够快速开发定制化和自动化的设计流程，同时具有高度可定制性和灵活性，通过引入新的优化和转换任务，不需要人类专业知识，可以在保持准确性的同时大幅度降低 DSP 和 LUT 使用，相较于现有技术，具有更高的精度和更少的 DSP 资源使用率。

Jun, 2023