自动构建知识图谱的梵语问答框架
本文描述了手动注释梵文文本,为知识图创建做出了努力。构建的知识图包含 410 个实体和 764 个关系,涵盖了 Bhavaprakashanighantu 的各种属性。
Feb, 2022
通过自动构建知识图谱的框架、引入本体驱动和通用任务的注释工具,以及提供多样化的网页界面、工具和软件库,我们在梵语的知识系统发展中解决了挑战与机遇,尤其在问答方面。这些贡献不仅提高了梵语文本分析的可访问性和准确性,而且为知识表达和语言处理领域的进一步发展铺平了道路。最终,这项研究对于保护、理解和利用梵语文本中所蕴含的丰富语言信息具有重要意义。
Jun, 2024
本文提出了 KGQAn,一个通用的 QA 系统,它不需要为每个目标 KG 进行定制,而是采用一种新颖的形式化方法将问题理解为一个文本生成问题,并通过神经序列到序列模型将问题转换为中间抽象表示。我们还开发了一个即时链接器,在查询时间使用 RDF 存储的公共可访问 API 和现有索引将抽象表示映射到特定 KG 的 SPARQL 查询,而无需任何预处理。我们在几个真实的 KG 上进行的实验表明,KGQAn 易于部署,对于任意的 KG 表现良好,优于现有的 QA 系统。
Mar, 2023
提出一种使用知识图谱扩展预训练文本到文本语言模型的方法,通过从知识图谱中提取子图,使用基于 Transformer 的模型线性化提取的子图并重新对答案候选项进行排序,使得预训练文本到文本语言模型的 Hits@1 评分提升 4-6%。
Oct, 2023
本论文研究了使用神经机器翻译范式进行问题解析的应用,采用序列到序列模型来学习 SPARQL 图查询语言及其组合中的图形模式。通过模板构建问题和查询之间的对齐情况,探讨半监督学习方法代替问题 - 答案对诱导程序,并且借助自然语言生成的新进展扩展语言表达的覆盖范围。
Jun, 2018
本文提出了一种基于 SPARQL 查询的多语言语义 Web 知识库问答(QA)方法,能够查询多个知识库,可轻松移植到其他知识库和语言。通过对五个不同的知识库和五种语言的评估,证明了该方法的影响。
Mar, 2018
BigText-QA 旨在开发一个综合 QA 系统,它能够回答基于一个知识图谱(KG)的更冗余形式的问题,该图谱将结构化和非结构化(即 “混合”)知识组织在统一的图形表示中,既有一个命名实体的规范集合,又有提供高度多样化的关系释义和丰富上下文信息的文本子句的开放集合。
Dec, 2022
通过自然语言技术,本论文的主要目标是使梵语手稿更便于最终用户使用。梵语的形态丰富、合成、词序自由和资源匮乏性为开发深度学习解决方案带来了重大挑战。论文针对四个基础任务,即词分割、依存分析、合成类型识别和诗歌分析,提出了有关梵语自然语言处理(NLP)技术的关键问题,并在解决这些挑战的过程中提出了多项贡献,包括提出了具有语言学信息的神经网络体系结构、展示了所提系统的可解释性和多语言扩展性、报道了最先进的性能以及开发了名为 SanskritShala 的神经工具套件。
Aug, 2023
本文介绍了使用自然语言处理技术的语义解析器,将用户的自然语言问题转化为有形式定义的查询语句,通过大规模知识图谱实现。作者提供了一个数据集,其中,用户问题采用 Sparql 语言解析,并对执行结果对系统回答进行注释。通过两种不同的语义解析方法,我们提出了挑战:如何处理大规模词汇,如何建模对话语境,如何处理多实体查询语句,并实现对新问题进行泛化。作者希望我们的数据集能够为开发会话式语义解析器提供有效的测试平台。本文的数据集和模型已经发布,详情请见链接。
Jan, 2023
本文提出了一种基于 AQG(一种统一的图形文法)的端到端模型,由高级解码生成用于约束搜索空间的 AQG 和底级解码构造查询图,旨在优化查询图构建过程,提高在复杂 KGQA 基准测试中的表现。
Nov, 2021