基于自动数据丰富的越南法律问答系统改进
该论文介绍了 NeCo 团队在 2023 年自动化法律问题回答竞赛(ALQAC 2023)中针对越南文本处理任务提供的解决方案,重点是通过数据丰富来实现对低资源语言的法律领域知识获取。我们的法律文档检索任务方法结合了相似性排名和深度学习模型,而对于第二个任务,要求根据问题从相关的法律文章中提取答案,我们提出了一系列适应性技术来处理不同类型的问题。我们的方法在竞赛的两个任务中都取得了出色的成绩,展示了法律领域中问答系统特别是对于低资源语言的潜在优势和有效性。
Sep, 2023
该研究旨在解决法律问答的问题,提供包括 14 个标准数据集和基于深度学习的法律问答模型在内的全面调查。该研究重点讨论了面临的挑战和不足,以及使用的不同方法和技术。
Apr, 2023
本文提出使用深度神经网络从越南法律问题中提取重要信息,采用三个阶段的深度模型,利用高级自编码语言模型、字符级和 POS 标签信息生成词表示,Bidirectional LSTM 模型捕捉单词之间的关系并生成句子级别的表示,然后使用 biaffine 分类器来评估每对起始 - 结束单词成为重要细节的概率。
Apr, 2023
这篇论文提出了 XLMRQA 作为第一个使用监督 transformer-based reader 和基于 Wikipedia 的语料库作为知识来源的越南问题回答系统,优于基于深度神经网络模型的 DrQA 和 BERTserini,同时分析了问题类型对 QA 系统性能的影响。
Apr, 2022
本文通过集成检索模型和利用多个预训练语言模型及去噪防护,开发了一种新型数据增强框架,以捕获未标记的策略文件中的相关文本段,并扩展训练集中的正面示例。使用此增强数据,该研究在 PrivacyQA 基准测试中将现有水平提高了 10% F1,实现了 50% 的新水平。(其中,F1 是一种综合度量,用于评估二元分类器的准确性。)
Apr, 2022
使用 OpenAI GPT 模型作为基准,结合查询提示,本研究比较分析了现有的人工智能模型在印度法律问答系统中回答法律问题方面的实用性,调查了不同的检索和问答算法的效果。该研究重点关注印度刑事司法领域的应用,该领域面临复杂性和资源限制的挑战。通过从实践法律专业人士获得反馈,以严格评估这些模型的性能,从而全面评估了 AI 在印度法律问答背景下的能力和局限性。
Sep, 2023
本研究使用句子转换器提出了一种新的越南法律文件信息检索方法,并通过多次实验比较不同的转换器模型、排名得分、音节层和单词层的训练,实验结果表明所提出的模型的表现优于当前越南文件信息检索的模型。
Sep, 2022
本研究探讨如何通过自动翻译和排列组合技术将已有的数据资源应用到多语种的问答系统中,并进行深入分析和提出未来数据集开发的建议,以提高多语种问答系统的覆盖面。
May, 2021