自动构建知识图谱的梵语问答框架

Oct, 2023

自动构建知识图谱的梵语问答框架

Framework for Question-Answering in Sanskrit through Automated Construction of Knowledge Graphs

Hrishikesh Terdalkar, Arnab Bhattacharya

TL;DR通过构建一个知识图谱以及应用该图谱回答事实型问题，本文探讨了从梵语文本中提取特定关系的难题，分析了系统在每个步骤中的不足之处，并讨论了未来的可能发展方向。

Abstract

sanskrit (sa\d{m}sk\d{r}ta) enjoys one of the largest and most varied literature in the whole world. Extracting the knowledge from it, however, is a challenging task due to multiple reasons including complexity of the language and paucity of standard →

sanskrit knowledge graphs natural language processing question-answering system factoid questions

发现论文，激发创造

基于半结构化阿育吠陀文本的语义注释和查询框架

本文描述了手动注释梵文文本，为知识图创建做出了努力。构建的知识图包含 410 个实体和 764 个关系，涵盖了 Bhavaprakashanighantu 的各种属性。

Feb, 2022

基于梵语知识的系统：注释和计算工具

通过自动构建知识图谱的框架、引入本体驱动和通用任务的注释工具，以及提供多样化的网页界面、工具和软件库，我们在梵语的知识系统发展中解决了挑战与机遇，尤其在问答方面。这些贡献不仅提高了梵语文本分析的可访问性和准确性，而且为知识表达和语言处理领域的进一步发展铺平了道路。最终，这项研究对于保护、理解和利用梵语文本中所蕴含的丰富语言信息具有重要意义。

Jun, 2024

知识图谱通用问答平台

本文提出了 KGQAn，一个通用的 QA 系统，它不需要为每个目标 KG 进行定制，而是采用一种新颖的形式化方法将问题理解为一个文本生成问题，并通过神经序列到序列模型将问题转换为中间抽象表示。我们还开发了一个即时链接器，在查询时间使用 RDF 存储的公共可访问 API 和现有索引将抽象表示映射到特定 KG 的 SPARQL 查询，而无需任何预处理。我们在几个真实的 KG 上进行的实验表明，KGQAn 易于部署，对于任意的 KG 表现良好，优于现有的 QA 系统。

Mar, 2023

大型语言模型与知识图谱相遇：回答事实性问题

提出一种使用知识图谱扩展预训练文本到文本语言模型的方法，通过从知识图谱中提取子图，使用基于 Transformer 的模型线性化提取的子图并重新对答案候选项进行排序，使得预训练文本到文本语言模型的 Hits@1 评分提升 4-6%。

Oct, 2023

神经机器翻译用于查询构建和组合

本论文研究了使用神经机器翻译范式进行问题解析的应用，采用序列到序列模型来学习 SPARQL 图查询语言及其组合中的图形模式。通过模板构建问题和查询之间的对齐情况，探讨半监督学习方法代替问题 - 答案对诱导程序，并且借助自然语言生成的新进展扩展语言表达的覆盖范围。

Jun, 2018

走向语义网上的问答系统

本文提出了一种基于 SPARQL 查询的多语言语义 Web 知识库问答（QA）方法，能够查询多个知识库，可轻松移植到其他知识库和语言。通过对五个不同的知识库和五种语言的评估，证明了该方法的影响。

Mar, 2018

大规模混合知识图谱上的问答系统

BigText-QA 旨在开发一个综合 QA 系统，它能够回答基于一个知识图谱（KG）的更冗余形式的问题，该图谱将结构化和非结构化（即 “混合”）知识组织在统一的图形表示中，既有一个命名实体的规范集合，又有提供高度多样化的关系释义和丰富上下文信息的文本子句的开放集合。

Dec, 2022

基于语言学的梵语词汇、句法和语义任务的神经网络结构

通过自然语言技术，本论文的主要目标是使梵语手稿更便于最终用户使用。梵语的形态丰富、合成、词序自由和资源匮乏性为开发深度学习解决方案带来了重大挑战。论文针对四个基础任务，即词分割、依存分析、合成类型识别和诗歌分析，提出了有关梵语自然语言处理（NLP）技术的关键问题，并在解决这些挑战的过程中提出了多项贡献，包括提出了具有语言学信息的神经网络体系结构、展示了所提系统的可解释性和多语言扩展性、报道了最先进的性能以及开发了名为 SanskritShala 的神经工具套件。

Aug, 2023

面向知识图谱的对话问答的语义解析

本文介绍了使用自然语言处理技术的语义解析器，将用户的自然语言问题转化为有形式定义的查询语句，通过大规模知识图谱实现。作者提供了一个数据集，其中，用户问题采用 Sparql 语言解析，并对执行结果对系统回答进行注释。通过两种不同的语义解析方法，我们提出了挑战：如何处理大规模词汇，如何建模对话语境，如何处理多实体查询语句，并实现对新问题进行泛化。作者希望我们的数据集能够为开发会话式语义解析器提供有效的测试平台。本文的数据集和模型已经发布，详情请见链接。

Jan, 2023

基于层次化查询图生成的知识图谱复杂问题回答：概述和填写

本文提出了一种基于 AQG（一种统一的图形文法）的端到端模型，由高级解码生成用于约束搜索空间的 AQG 和底级解码构造查询图，旨在优化查询图构建过程，提高在复杂 KGQA 基准测试中的表现。

Nov, 2021