可验证性的核心演算法

Oct, 2013

A Core Calculus for Provenance

Umut A. Acar, Amal Ahmed, James Cheney, Roly Perera

TL;DR本文介绍了一种形式化的 Provenance 安全框架，探讨在通用程序语言方面的有效性并提出了关于披露和混淆方面的正式定义。研究了针对追踪语义的生产力视角，使用了算法来解决披露和混淆问题。

Abstract

provenance is an increasing concern due to the ongoing revolution in sharing and processing scientific data on the Web and in other computer systems. It is proposed that many computer systems will need to become provena

provenance formal framework disclosure obfuscation general-purpose programming language

发现论文，激发创造

溯源作为依赖关系分析

本论文提出依赖关系分析技术作为数据来源或历史的形式化基础，探讨了相应的数据溯源机制和静态 / 动态逼近方法。

Aug, 2007

仪表盘渊源建模

该论文旨在提供一种专为仪表板及其可视化和数据组件设计的溯源表示模型，以提供一套完整的基本溯源元数据，使用户能够评估仪表板上呈现的信息的质量、一致性和可靠性，从而在特定仪表板开发的上下文中实现清晰而准确的理解，最终促进更好的决策制定。

Aug, 2023

轻量级描述逻辑的半环来源

我们研究了半环溯源，它是一个最初在关系数据库环境中定义的成功框架，用于描述逻辑。我们定义了一种在包含多个轻量级描述逻辑的语言上的溯源语义，并展示了它与具有特定类型注释的本体所定义的语义的关系。我们重点关注了众所周知的 why 溯源，对于每个可加且可乘幂等的交换半环，计算了半环溯源，并研究了与公理或连词查询答案溯源相关的问题的复杂性。最后，我们考虑了两种更加限制的情况，它们对应于数据库环境中的正 Boolean 溯源和谱系。对于这些情况，我们展示了与描述逻辑解释相关的众所周知概念的关系，并完成了复杂性分析。此外，我们还提供了 ELHI_bot 本体的一些条件以保证具有可处理的推理。

Oct, 2023

Datalog 查询的 Why-Provenance 复杂性

本文旨在填补 why-provenance 计算复杂性方面的空白，我们确定了 Datalog 查询和其子类的 why-provenance 的数据复杂度，得出结论，由于其计算复杂性的特殊性质，递归查询的 why-provenance 是一个棘手的问题。

Mar, 2023

描述逻辑 ELHr 的溯源

本文章针对 ELHr 本体中的溯源信息问题，基于整环和扩展经典数据溯源的本体数据访问，对本体公理进行注释来生成溯源多项式，并分析了 ELHr 案例的语义，揭示如何处理省略符号所带来的种种困难，其中一些困难可以通过假定整环的乘法幂等性来缓解。在此基础上，研究了三个问题：使用溯源信息来生成完整的本体，计算得到与结论相关的公理集，并进行查询回答。

Jan, 2020

供应链溯源本体驱动的区块链设计

本文旨在探讨在大数据时代中使用区块链和本体论技术实现物品溯源的可行性，并分析了一种可追溯性本体论，并将其转换为以太坊区块链平台上的智能合约。

Aug, 2016

树形和类树形实例的溯源电路（扩展版）

该论文提出了一种基于单调二阶逻辑的查询可验证性框架，它利用树形自动机构造电路并连接到关系实例上，从而计算出查询输出的证明，并且应用于树形和树状实例中的计数和概率计算。

Nov, 2015

ProVe: 知识图谱自动溯源验证流程与文本来源的一致性

ProVe 是一个自动验证知识图谱三元组是否由所记录的来源文本支持的工具，主要应用于信息策划领域，包括基于规则的方法和机器学习模型，对 Wikidata 数据集进行了评估，并在文本丰富的数据源上实现了优异的支持检测二元分类任务，准确率为 87.5％，F1-macro 为 82.9％。

Oct, 2022

Kairos：使用整体系统溯源的实用入侵检测和调查

KAIROS 是一种基于图神经网络的编码器 - 解码器架构，它学习了溯源图的结构变化的时间演变，以量化每个系统事件的异常程度；基于这些细粒度信息，KAIROS 重构攻击的足迹，在系统审计日志流中生成能准确描述恶意活动的简洁摘要图，使用最先进的基准数据集，我们证明了 KAIROS 优于以前的方法。

Aug, 2023

数据溯源倡议：大规模人工智能数据集许可和归属审计

我们在语言模型的训练中发现了数据透明性和道德风险的问题，因此我们进行了一项多学科工作，对 1800 多个文本数据集进行了系统审计和追踪。我们发展了工具和标准，以跟踪这些数据集的来源、创作者、许可条件、属性和使用情况。我们的分析突出了商业开放数据集与封闭数据集在构成和重点方面的差异，封闭数据集垄断了重要的类别。此外，我们的研究还发现了广泛使用的数据集托管网站上许可证的错误和遗漏。为了促进数据集的透明性和负责任使用，我们发布了我们的审计结果，并提供了一个交互式界面，数据溯源浏览器，让从业者可以追踪和筛选最流行的开源调整数据集的数据溯源信息：www.dataprovenance.org。

Oct, 2023