PDPK:一种用于制造业的综合流程数据和相应流程知识的框架
本文介绍了一种名为 ProcessGAN 的生成敌对网络模型,用于保护带有机密信息的过程数据,该模型通过表征学习从而生成与真实数据难以区分的合成数据,并在医学领域的真实数据集上进行了评估。
Mar, 2022
本文从新的角度为 LLMs 提供基本知识并评估其有效性,通过广泛实验得出结论:(1)在大多数任务中,声明性知识比过程性知识产生更多益处。(2)只有在简单逻辑推理任务中,过程性知识的收益才大于声明性知识。(3)随着预训练的进行和规模的增大,模型利用两种知识的能力显著提高,但速度不同。我们对这些发现进行了详细分析,为评估和增强大型语言模型提供了主要指导。
Mar, 2024
本文提出了第一个将程序性知识或 “技能” 集成到 Linked Data Cloud 中的框架,通过将通用技能表示为 Linked Data 和自动获取 Web 上现有资源的表示,自动生成不同知识资源之间和其他在线知识库(例如 DBpedia)之间的链接,并展示了该框架在实际场景中的应用结果及如何优于现有的基于社区驱动的手动融合工作。
Apr, 2016
本文介绍了一种系统性的方法来生成高度逼真、注释的合成数据,以用于计算机视觉任务的深度神经网络的训练。该方法的主要贡献是一种程序性的世界建模方法,能够产生高度可变性和物理准确性的图像合成,并且它是从手工建模的虚拟世界和在实时应用中使用的近似图像合成方法中脱颖而出的。我们的方法的优点包括灵活性、物理精确性、可扩展的图像合成、隐式广泛的类和特征覆盖以及完整的数据自检测以进行注释,所有这些都有助于质量和成本的效率。在本文中,我们以自动驾驶车辆和机器人导航的语义分割为主要应用,使用合成数据对多个深度学习体系结构进行了训练和微调。评估表明,我们的方法提高了神经网络的性能,即使是适度的实施工作也能产生最先进的结果。
Oct, 2017
本研究旨在提供一个全面的流派统一的方案折衷了 PPDS 领域中的两种主要方法:统计方法和基于深度学习的方法,在提供了完整的参考表格和关键点摘要以及确定了实际应用中指导方法选择的准则之后,为 DLM 方法在私密图像合成方面提供了基准测试,并鉴别出 DP-MERF 是一种全能方法。
Jul, 2023
新产品的快速制定对于在全球制定产品市场取得成功至关重要;然而,关键产品指标(KPI)可能是化学成分和处理历史的复杂且理解不足的功能。本研究提出了一种新的数字框架,通过将符号回归(SR)与基于模型的设计实验(MBDoE)相结合,以加速过程流程图(PFD)的优化和知识发现。研究表明,该框架能够在几次迭代中有效发现真实的过程机制,表明其在数字制造和产品创新的广泛化学行业中具有巨大的潜力。
May, 2024
研究了手续性文本理解的挑战,发现外部知识注入和数据不足的问题,提出了一个多阶段训练的知识感知 KOALA 模型,最终在 ProPara 和 Recipes 数据集上达到了最先进的性能表现。
Sep, 2020
本研究旨在利用视频表示学习技术,通过构建 Procedural Knowledge Graph (PKG) 生成伪标签来训练视频表示模型,以提高多种程序理解任务的精度。其中 PKG 结构由通过无标签的教学视频和基于文本的程序知识库信息融合而成,训练数据使用了四个新的预训练目标。最终模型 Paprika 在 12 个任务上实现了高达 11.23% 的精度提升。
Mar, 2023
合成数据用于训练深度神经网络在计算机视觉应用中的重要性,重点探讨了在生产环境中使用的合成数据生成过程以及通过不同组合方法在减少仿真与现实差距方面的改进。
Nov, 2023