- 开放数据与生成型人工智能的场景谱系探索
开放数据和生成式人工智能的关系及其可能带来的创新潜力是尚未完全探索的领域,本文提出了一种新的开放数据第四波的情景框架,其中列举了开放数据与生成式人工智能可能相交的一些情景并探讨了实现这些情景所需的数据质量和出处方面的要求,同时指出为了充分利 - 多作者文档的文体分析和作者风格变化检测
本文研究了基于文体分析技术的三项主要任务:单作者和多作者文档的分类、单一变换检测以及多作者文档中的作者变换检测。通过整合多种自然语言处理算法和权重优化技术的基于优势的融合框架,本文提出了一种解决方案,并通过对清洗和原始数据集的大量实验探索了 - 朝可证实的文本生成方向前进:带有符号引用
该论文提出了符号基于生成(SymGen)的方法,通过与条件数据中的显式符号引用交替输出文本,实现对大语言模型(LLMs)输出文本的验证和溯源,从而减少人工验证的工作量,同时保持流畅和准确。
- 仪表盘渊源建模
该论文旨在提供一种专为仪表板及其可视化和数据组件设计的溯源表示模型,以提供一套完整的基本溯源元数据,使用户能够评估仪表板上呈现的信息的质量、一致性和可靠性,从而在特定仪表板开发的上下文中实现清晰而准确的理解,最终促进更好的决策制定。
- 寻迹卷轴:透过绘画溯源窥探历史
通过使用手卷绘画作品,我们提出了一种名为 ScrollTimes 的系统,它结合了图像处理技术和语言模型,可用于追踪历史背景并揭示手卷绘画作品的历史性价值。
- ProVe: 知识图谱自动溯源验证流程与文本来源的一致性
ProVe 是一个自动验证知识图谱三元组是否由所记录的来源文本支持的工具,主要应用于信息策划领域,包括基于规则的方法和机器学习模型,对 Wikidata 数据集进行了评估,并在文本丰富的数据源上实现了优异的支持检测二元分类任务,准确率为 8 - EMNLP如何使生物医学问答系统投入实践?
医学问答系统存在适时回答临床医生有关治疗和诊断不确定性的潜力,但是由于透明度、可靠性和来源不可靠等因素未得到考虑,因此医学问答系统仍未被广泛应用。本文提出了一组标准,旨在提高生物医学问答系统的实用性,并评估了现有模型、任务和数据集,指出了以 - 机器学习流水线:来源追溯性、可重现性和 FAIR 数据原则
本文介绍了支持机器学习流程端到端可重复性的目标和初步步骤,探讨了除源代码和数据集可用性之外影响机器学习实验证明性的因素,并提出了将 FAIR 数据实践应用于机器学习流程的方法。文中将 ProvBook 作为工具,分析了 Jupyter No - 引用功能和来源的神经多任务学习
本研究使用卷积神经网络进行引用文献中的引用作用和来源定位任务,并通过多任务学习得到显著的性能提升。
- 通过供应商的合规声明提高 AI 服务的信任度
使用 FactSheets 来描述人工智能 (AI) 服务的目的、性能、安全、安全和渊源等信息,以提高消费者对 AI 服务的信任度。
- 供应链溯源本体驱动的区块链设计
本文旨在探讨在大数据时代中使用区块链和本体论技术实现物品溯源的可行性,并分析了一种可追溯性本体论,并将其转换为以太坊区块链平台上的智能合约。
- 可验证性的核心演算法
本文介绍了一种形式化的 Provenance 安全框架,探讨在通用程序语言方面的有效性并提出了关于披露和混淆方面的正式定义。研究了针对追踪语义的生产力视角,使用了算法来解决披露和混淆问题。
- MM溯源作为依赖关系分析
本论文提出依赖关系分析技术作为数据来源或历史的形式化基础,探讨了相应的数据溯源机制和静态 / 动态逼近方法。