Oct, 2022

利用预训练模型进行故障分析三元组生成

TL;DR本文研究了利用 Transformer 模型的注意机制为下游任务生成半导体行业中的故障分析三元组(FATs)。发现使用 1.5B 参数进行训练的 GPT2 模型在 ROUGE 上的表现显著优于 BERT、BART 和 GPT3 等其他 Transformer 模型,在人类评估和结构化 FAT 数据方面引入了 Levenshstein 顺序评估度量(LESE)。