少即是多:在产品问答中拒绝不可靠的评论
使用混合专家框架,本文旨在自动学习如何判断一个产品评论是否与给定查询相关,并在一个包括 1.4 百万个问题和答案以及 13 百万个评论的语料库上评估我们的系统,Moqa,并表明它对于处理二元和开放性查询都有效,在定性研究中还展示了这个系统能够提供人工评估认为相关的评论。
Dec, 2015
该研究提出了基于评论的问答系统,并介绍了一个新的数据集和结合信息检索和阅读理解模型的方法以生成答案。研究评估了许多答案生成模型并提出了强有力的基线,证明了这个新任务的挑战性。
Aug, 2019
本文系统地回顾现有的产品问答研究,将 PQA 研究分为四种问题设置,并分析了各种设置的优缺点、现有数据集和评估协议。同时,作者总结了 PQA 所特有的最重要的挑战,并讨论了它们对应的解决方案和未来研究方向。
Feb, 2023
通过考虑个性化和模棱两可性,我们创建了一个包含大约 80 万个问题和 310 万个答案的新问题回答数据集,发现考虑主观答案的个性化因素能够得到定量上更好的答案,并提供更细致的支持性观点。
Oct, 2016
本论文提出了一种新型的预测产品相关问题答案的方法,该方法基于相似问题以及相似产品的答案来进行判断,并使用专家混合模型框架聚合答案来提高预测准确率。经实证结果表明,该模型在某些问题的表现优于强基线,而且我们还出版了两个大规模数据集用于支持我们的方法。
May, 2021
本文提出了一种名为 PAAG 的基于对抗学习的模型来解决电子商务中针对产品相关问题的答案生成问题,其中包括通过大规模未标注的电子商务评论和产品属性生成准确且完整的答案。在一个大规模的真实电子商务数据集上进行的广泛实验验证了我们模型中每个模块的有效性,并且我们的实验表明,我们的模型在自动指标和人工评估方面均实现了最先进的性能。
Jan, 2019
这项工作通过提出一种新的任务,即自动化的质量分析和数据清洁来收集高质量的社交媒体问答数据集,并使用基于 BERT 的模型进行了评估。我们的最佳方法包括一个单任务模型和一个多任务模型,可以确定问题和响应的合理性,并提取回答。
Nov, 2020
利用 PubMed 作为可靠的医学研究文档集合,针对开放领域的问答设置,研究通过修改检索设置来提高问答系统性能的方法。结果显示,减少检索到的文档数量,偏爱近期和被引用次数较多的文献可以提高最终的宏观 F1 得分达到 10%。
Apr, 2024
本文提出了一种基于统一模型的答案生成方法,通过 opinion mining 解决 product-related question answering 中因个人意见多样性带来的挑战,实现 opinion-aware 答案生成,并通过多视角 pointer-generator 网络实现答案生成和意见挖掘任务之间的联合学习和意见融合策略,取得了在实际 E-Commerce QA 数据集中优越表现。
Aug, 2020
本文分析了预训练语言模型在信息查找问题回答方面的挑战和解决方案,包括段落选择和答案预测。作者人手对多语言数据集进行了分类和标注,在此基础上提出了未来在数据集收集和模型开发方面的研究前景。
Oct, 2020