VlogQA: 越南口语问答的任务、数据集和基线模型
本文介绍了一个名为 UIT-ViQuAD 2.0 的越南文机器阅读理解数据集,它可以用于评估和研究机器阅读理解任务和相关任务,如问答、问句生成和自然语言推理。该数据集吸引了 77 个团队参与,其中表现最好的三个团队使用基于 Transformer 结构的强大的预训练语言模型 XLM-RoBERTa,其准确率在 F1 得分方面为 77.24%,在 Exact Match 方面为 67.43%。
Mar, 2022
本研究为缺乏基准数据集的低资源语言(如越南语)创建了一个新的数据集 UIT-ViQuAD,包含超过 23000 个由人类创建的问题 - 答案对和 174 篇来自维基百科的越南文章。通过用现有最先进的机器学习模型解决问题来比较联合测量人类表现和最佳模型表现的结果,结果表明,未来的研究可以提高越南 MRC 的准确度和性能。
Sep, 2020
介绍了 ViNewsQA,这是用于越南语的一种新的用于评估医疗领域阅读理解模型的语料库,其中包含 22057 个人工生成的问题 - 答案对和比较人类和不同机器阅读理解方法的性能,其中 ALBERT 模型在该语料库上获得了最好的性能。
Jun, 2020
提出了 ViMMRC 2.0,结合多步骤的注意力神经网络和自然语言推理任务,对越南语文本进行了阅读理解测试,结果表明其在新数据集上的测试正确率最高可达 58.81%。
Mar, 2023
本文介绍了利用多个神经网络模型对低资源语言(越南语)中的多项选择机器阅读理解的影响进行的实验,其中使用了六种不同的越南语单词嵌入和 BERT 模型,在 ViMMRC 语料库上的测试集中,BERT 模型的准确率为 61.28%。
Aug, 2020
这篇论文提出了 XLMRQA 作为第一个使用监督 transformer-based reader 和基于 Wikipedia 的语料库作为知识来源的越南问题回答系统,优于基于深度神经网络模型的 DrQA 和 BERTserini,同时分析了问题类型对 QA 系统性能的影响。
Apr, 2022
该研究介绍了韩语问答数据集(KorQuAD),这是一个用于机器阅读理解的大型韩语数据集,有助于自动回答语音机器人和自动化客户支持系统的开发。
Sep, 2019
本研究提出了一个名为 VisualMRC 的新的视觉机器阅读理解数据集,包含来自多个网络域的 10,000 多个文档图像,以及 30,000 多个问题和答案对,以帮助发展自然语言理解和生成能力。此外,研究还引入了一个扩展了现有序列到序列模型的新模型,以考虑文档的视觉布局和内容。该模型在自动评估度量方面优于基本序列到序列模型和最先进的 VQA 模型,但其性能仍低于大多数人类表现。该数据集将有助于将视觉和语言理解联系起来的研究。
Jan, 2021
本文介绍了 OpenViVQA:首个包含越南语开放式答案的大规模 VQA 数据集,包括 11,000 + 图像和 37,000+ 问答对,并提出了三个融合图像和答案信息的方法(FST,QuMLAG 和 MLPAG),并使用这些融合的特征构建答案,旨在促进研究社区针对越南语这类低资源语言开发出更广义的算法,结果与 SOTA 模型竞争力相当。
May, 2023
通过提供一个新的数据集 ViOCRVQA,这篇研究论文在 OCR-VQA 任务中引入了一种称为 VisionReader 的新方法,并对该数据集进行了实验,揭示了越南数据集所固有的挑战和困难。
Apr, 2024