通过开发一种利用文本到文本转换模型的端到端系统,本文研究了常见问题解答(FAQ)的生成作为一项明确定义的自然语言处理(NLP)任务,并且通过对传统问答系统的文献综述提出了我们的系统,能够根据特定领域的文本内容构建相关的 FAQ,提高准确性和相关性。我们利用自定义算法获取信息的最佳表示形式并对问题 - 答案对进行排名,以提高人类理解能力。定性人体评估显示生成的 FAQ 构思良好,易读,并利用特定领域的构造来突出原始内容中的领域差异和行业术语。
Feb, 2024
本文介绍了 ParaQG, 一种基于序列到序列技术的 Web 服务,通过交互式界面,从句子和段落中生成问题,并利用多种分组和过滤技术使生成问题的过程用户友好化。
Sep, 2019
一种促进阅读理解的策略是以问答形式呈现信息。我们展示了一个集成了问答和问题生成任务的系统,用于生成传达多段文档内容的问答项。我们报告了一些 QA 和 QG 的实验结果,并评估了它们如何相互作用以产生文本的 Q&A 列表。该演示可在 qna.sdl.com 上访问。
Mar, 2021
提出了一种基于未监督信息检索和 BERT 模型的 FAQ 检索系统,用于回答用户的查询,该系统通过计算用户问题和问题之间的相似度以及问题和答案之间的相关性来检索数据。该系统在两个数据集评估中表现出了优异的性能表现。
May, 2019
使用自然语言处理模型进行问答生成在我们周围是非常普遍的。它在许多用例中被使用,例如构建聊天机器人,在谷歌搜索中提供提示以及作为银行移动应用程序中的信息导航方式等。我们的研究主要调查通过人类生成的数据对模型性能的影响。
Nov, 2023
通过建立一个意图感知的 FAQ 检索系统,实现在产品搜索中集成 FAQ 检索,提高用户购买决策和购后支持满意度。
Jun, 2023
本文介绍了我们使用传统语言学方法和多种机器学习技术生成英语非结构化文本问句的框架,并且加入了问题评估模块,最终证明我们的生成问题质量优于其他最好的系统,并且与人类创建的问题相当。
May, 2022
本文探讨了自动化生成基于文本相似度的查询,介绍了数据集和基于预训练大型语言模型的基于规则和自动化文本生成方法,并提出了一种优秀的混合方法。
Mar, 2023
本篇研究针对教科书段落的无关答案问题生成模型的适用性进行可行性研究,研究表明通过提供摘要信息,可以降低由无关或难以解释问题产生的错误, 为模型提供人工编写的摘要信息在生成问题的可接受性方面产生了重大的提高,同时,发现在没有人工编写的摘要信息的情况下,自动摘要仍可发挥中间作用。
Mar, 2022
使用 Wizard of Oz 的方法结合众包技术,从三个 Stack Exchange 网站收集了 2437 组对话和 10917 个问答信息,构建了 DoQA 数据集,为 FAQ 站点中的大量领域特定信息构建了面向对话的问答(QA)界面,并介绍了更多的实际检索信息场景,取得了良好的性能。
May, 2020