通过知识图谱让凯楚亚语更接近最终用户
本文介绍了 QICHWABASE,通过采用 Wikibase 实例构建的方法和工具来提高韦查语(Quechua)语言和知识的存在感,支持少数民族社区的和谐化过程。
Apr, 2023
我们通过爬取广泛的语音语料库并应用数据增强方法,为五种土著语言(Quechua、Guarani、Bribri、Kotiria 和 Wa'ikhana)提供了可靠的自动语音识别(ASR)模型,其中包括 Wav2vec2.0 XLS-R 模型的不同变体
Apr, 2024
通过构建一个知识图谱以及应用该图谱回答事实型问题,本文探讨了从梵语文本中提取特定关系的难题,分析了系统在每个步骤中的不足之处,并讨论了未来的可能发展方向。
Oct, 2023
构建基于巴西历史的知识图谱的第一步是利用巴西历史人物传记字典和维基百科 / 维基数据。我们认为巴西命名实体(人物、地点、组织、政治事件和运动)的大型存储库对于从葡萄牙文本中提取信息是有益的。我们展示了 DHBB 中描述的许多术语 / 实体在维基百科结构化数据库 Wikidata 中没有相应的概念(或 Q 项)。我们描述了从 DHBB 中提取信息的先前工作,并概述了构建基于 Wikidata 的历史知识图谱的步骤。
Mar, 2024
通过将高质量问题的翻译引入到最受欢迎的 KGQA 基准测试之一 QALD-9 中,从 DBpedia 到 Wikidata 的迁移和添加 8 种语言的支持来扩展 QALD-9 基准测试,从而增强了数据集的可用性和相关性,该数据集称为 QALD-9-Plus,将提供在线支持。
Jan, 2022
本文提出了 KGQAn,一个通用的 QA 系统,它不需要为每个目标 KG 进行定制,而是采用一种新颖的形式化方法将问题理解为一个文本生成问题,并通过神经序列到序列模型将问题转换为中间抽象表示。我们还开发了一个即时链接器,在查询时间使用 RDF 存储的公共可访问 API 和现有索引将抽象表示映射到特定 KG 的 SPARQL 查询,而无需任何预处理。我们在几个真实的 KG 上进行的实验表明,KGQAn 易于部署,对于任意的 KG 表现良好,优于现有的 QA 系统。
Mar, 2023
本文介绍了 QuoteKG ,即第一个多语言名言知识图谱,该图谱通过从 Wikiquote 中提取名言,并将不同的引用对齐来建立名言及其上下文的真实性,包括了来自 $55$ 种语言的将近一百万条名言,由 $69,000$ 多位公众人物说出,覆盖了广泛的主题,并通过 SPARQL 端点公开提供。
Jul, 2022
数字媒体为人们探究和分享世界文学作品和作者提供了非凡的机会。本文介绍了基于知识图谱的全球文学知识库,其中包含约 194,346 位作家和 965,210 部作品,专门用于探索世界各地文学作品和作者的相关信息。此资源通过在线可视化平台提供,可提升人们的工作效率和取得有价值的成果。
Jul, 2023