社区问答中专家推荐的调查
本研究使用问题者的背景信息及其他特征,例如文本内容或者与其他参与者的关系,并利用 Stack Exchange 数据集进行训练,提出一种预测最佳答案的新方法,并且证明了用户间的关系对结果具有重要影响。同时,我们发现用户关系信息与文本特征和元特征(如时间差异)之间有较少的重叠。
Dec, 2022
本文对 2016 至 2021 年所发表关于问答系统的各项研究进行了回顾与总结,发现多轮问答系统已取代了单轮问答系统的先前主导地位,这表明了其在提高人工智能对话系统方面的重要性,同时也描绘了开展更多进一步和有利的研究的未来研究方向。
Jun, 2021
我们的研究关注于健康答案的基于方面的总结,以解决信息不全的问题。我们提出了一个多阶段的注释指南和一个独特的数据集,包括基于方面的人工编写的健康答案总结。我们利用该数据集构建了一个自动化的多方面答案总结流程,使用了几种最先进的模型进行特定任务的微调。该流程利用问题相似性检索相关的回答句子,然后将其分类为适当的方面类型。接下来,我们使用几种最新的抽象总结模型生成基于方面的总结。最后,我们进行了全面的人工分析,发现我们的总结在捕捉相关内容和各种解决方案方面排名靠前。
May, 2024
本文介绍了 SemEval-2015 Task 3 的组织和结果,以分类好、坏或潜在相关的答案,并回答 List of all answers 的 Yes / No 问题。我们使用 Mechanical Turk 对英语进行了广泛的数据标记,并已向研究社区发布。最好的系统在官方评分上看得分达到了 57.19 和 63.7(英语子任务 A 和 B),以及阿拉伯语子任务 A 的 78.55。
Nov, 2019
该研究提出了一种新的社区问答(CQA)总结任务,旨在从 CQA 对中创建简洁的摘要,并通过一系列数据注释和方法比较建立了一个强大的基线方法 DedupLED,进一步确认了 CQA 总结任务中的两个关键挑战,即句子类型转换和去重移除。
Nov, 2022
本研究通过分析六个广受欢迎的 CQA 平台中的元数据、问题的表述以及用户之间的互动水平与首次回答问题所需的时间之间的相关性,并运用传统机器学习模型预测哪些问题将会迅速获得首次回复。
Sep, 2023
该研究利用新颖的联合学习模型解决 CQA 中答案冗余和长度问题,设计了一个以问题为导向的指针生成网络,同时利用答案给长回答降噪,构建了一个包含长回答和参考摘要的大规模 CQA 语料库 WikiHowQA,实验证明该方法可以有效地解决 CQA 中的冗余问题,并取得了在答案选择和文本摘要任务上的最新成果。
Nov, 2019
本文的主要研究领域是关于自动问答,重点介绍了知识图谱、非结构化文本和混合语料库等来源的家族算法,并讨论了每个子主题中涉及的复杂性问题和系统中介绍的可解释性和互动性程度,最后总结了 QA 领域的最具前景的新兴趋势。
Apr, 2020
本研究提出了一种针对社区问答的二分类(相关 / 不相关)策略,采用敌对训练框架缓解标签失衡问题,并使用生成模型迭代地抽样一组具有挑战性的负样本,最终提高模型预测性能。此外,我们使用多尺度匹配方法显式地检查不同粒度级别的单词和 ngram 之间的相关性。在 SemEval 2016 和 SemEval 2017 数据集上进行评估,结果表明该方法达到或接近最佳性能。
Apr, 2018
本研究对社区问答的答案排名进行了深入的研究,基于大规模的 Stack Overflow 问题和回答数据,利用深度学习方法 (密集嵌入和 LSTM 网络) 进行预测和排序,提高了问答的准确度,但由于源码中大量的 oov 词汇,深度学习模型的性能提升由限制,未来应开发新的方法以解决该问题。
Oct, 2022