PDPK：一种用于制造业的综合流程数据和相应流程知识的框架

Aug, 2023

PDPK：一种用于制造业的综合流程数据和相应流程知识的框架

PDPK: A Framework to Synthesise Process Data and Corresponding Procedural Knowledge for Manufacturing

Richard Nordsieck, André Schweizer, Michael Heider, Jörg Hähner

TL;DR使用一个可用于不同领域的综合数据集生成框架，模拟参数化流程并提供一致的流程数据，将出色的嵌入方法与知识图形进行比较，验证合成数据集的整体特征与真实数据集的可比性。

Abstract

procedural knowledge describes how to accomplish tasks and mitigate problems. Such knowledge is commonly held by domain experts, e.g. operators in manufacturing who adjust parameters to achieve quality targets. To the best of our knowledge, no →

procedural knowledge real-world datasets knowledge graphs embedding methods synthetic datasets

发现论文，激发创造

利用深度生成模型生成保护隐私的过程数据

本文介绍了一种名为 ProcessGAN 的生成敌对网络模型，用于保护带有机密信息的过程数据，该模型通过表征学习从而生成与真实数据难以区分的合成数据，并在医学领域的真实数据集上进行了评估。

Mar, 2022

元认知分析：对数据集和大型语言模型中的陈述性和程序性知识进行评估

本文从新的角度为 LLMs 提供基本知识并评估其有效性，通过广泛实验得出结论：（1）在大多数任务中，声明性知识比过程性知识产生更多益处。（2）只有在简单逻辑推理任务中，过程性知识的收益才大于声明性知识。（3）随着预训练的进行和规模的增大，模型利用两种知识的能力显著提高，但速度不同。我们对这些发现进行了详细分析，为评估和增强大型语言模型提供了主要指导。

Mar, 2024

将专业技能融入链接数据云

本文提出了第一个将程序性知识或 “技能” 集成到 Linked Data Cloud 中的框架，通过将通用技能表示为 Linked Data 和自动获取 Web 上现有资源的表示，自动生成不同知识资源之间和其他在线知识库（例如 DBpedia）之间的链接，并展示了该框架在实际场景中的应用结果及如何优于现有的基于社区驱动的手动融合工作。

Apr, 2016

汽车应用中的合成数据生成的程序建模和基于物理的渲染

本文介绍了一种系统性的方法来生成高度逼真、注释的合成数据，以用于计算机视觉任务的深度神经网络的训练。该方法的主要贡献是一种程序性的世界建模方法，能够产生高度可变性和物理准确性的图像合成，并且它是从手工建模的虚拟世界和在实时应用中使用的近似图像合成方法中脱颖而出的。我们的方法的优点包括灵活性、物理精确性、可扩展的图像合成、隐式广泛的类和特征覆盖以及完整的数据自检测以进行注释，所有这些都有助于质量和成本的效率。在本文中，我们以自动驾驶车辆和机器人导航的语义分割为主要应用，使用合成数据对多个深度学习体系结构进行了训练和微调。评估表明，我们的方法提高了神经网络的性能，即使是适度的实施工作也能产生最先进的结果。

Oct, 2017

SoK：隐私保护数据合成

本研究旨在提供一个全面的流派统一的方案折衷了 PPDS 领域中的两种主要方法：统计方法和基于深度学习的方法，在提供了完整的参考表格和关键点摘要以及确定了实际应用中指导方法选择的准则之后，为 DLM 方法在私密图像合成方面提供了基准测试，并鉴别出 DP-MERF 是一种全能方法。

Jul, 2023

将知识引导的符号回归与基于模型的实验设计相结合以自动化流程图开发

新产品的快速制定对于在全球制定产品市场取得成功至关重要；然而，关键产品指标（KPI）可能是化学成分和处理历史的复杂且理解不足的功能。本研究提出了一种新的数字框架，通过将符号回归（SR）与基于模型的设计实验（MBDoE）相结合，以加速过程流程图（PFD）的优化和知识发现。研究表明，该框架能够在几次迭代中有效发现真实的过程机制，表明其在数字制造和产品创新的广泛化学行业中具有巨大的潜力。

May, 2024

多阶段训练的知识感知程序文本理解

研究了手续性文本理解的挑战，发现外部知识注入和数据不足的问题，提出了一个多阶段训练的知识感知 KOALA 模型，最终在 ProPara 和 Recipes 数据集上达到了最先进的性能表现。

Sep, 2020

专业技能的语义化网络：面向社区中心任务的联结数据

该论文探讨如何将社区技术知识在语义 Web 上进行表述，并提出了一种能够自动获取真实任务的过程性知识的新型框架。

Oct, 2014

面向操作流程的指导视频理解预训练

本研究旨在利用视频表示学习技术，通过构建 Procedural Knowledge Graph (PKG) 生成伪标签来训练视频表示模型，以提高多种程序理解任务的精度。其中 PKG 结构由通过无标签的教学视频和基于文本的程序知识库信息融合而成，训练数据使用了四个新的预训练目标。最终模型 Paprika 在 12 个任务上实现了高达 11.23% 的精度提升。

Mar, 2023

在生产环境中构建综合数据以弥合仿真与真实世界之间的差距

合成数据用于训练深度神经网络在计算机视觉应用中的重要性，重点探讨了在生产环境中使用的合成数据生成过程以及通过不同组合方法在减少仿真与现实差距方面的改进。

Nov, 2023