- 利用预训练和大型语言模型提升社区问答中的答案选择
本文提出了使用预训练模型的 Question-Answer 交叉注意网络(QAN)进行回答选择,并利用大型语言模型(LLM)来进行具有知识增强的回答选择。实验证明,QAN 模型在 SemEval2015 和 SemEval2017 数据集上 - 社区问答任务中的学习排序特征工程
在这项工作中,我们通过实证研究了社区问答论坛的几个方面,包括引入一种基于 BERT 的特征捕捉问题和答案的语义相似性、使用线性方式结合问题和答案特征、以及在 CQA 领域中采用迄今为止未使用过的排序学习算法等。在三个标准 CQA 数据集上, - 评估潮起潮落:跨多个平台深度分析问答趋势
本研究通过分析六个广受欢迎的 CQA 平台中的元数据、问题的表述以及用户之间的互动水平与首次回答问题所需的时间之间的相关性,并运用传统机器学习模型预测哪些问题将会迅速获得首次回复。
- 编程社区问答中的命名实体预测贝叶斯网络
本研究提出了一种基于贝叶斯网络的自然语言处理方法,可以预测和分析上下文,并可以应用于社区问答领域,通过与基线模型的比较,我们的方法在精度指标方面表现更好,同时讨论了罚项对贝叶斯网络结构的影响,以及有向无环图在分析语义关系方面的可视化表示。
- 社区问答平台上跨语言的任务偏好
使用实体嵌入模型分析多语言社区问答平台上不同语言社区的在线任务偏好和趋势,为平台提供更好的定制化内容服务,并为涉足非英语使用者市场的企业提供有价值的见解。
- 利用用户信息在问答网站中预测最佳答案
本研究使用问题者的背景信息及其他特征,例如文本内容或者与其他参与者的关系,并利用 Stack Exchange 数据集进行训练,提出一种预测最佳答案的新方法,并且证明了用户间的关系对结果具有重要影响。同时,我们发现用户关系信息与文本特征和元 - 社区问答中的答案排序:一种深度学习方法
本研究对社区问答的答案排名进行了深入的研究,基于大规模的 Stack Overflow 问题和回答数据,利用深度学习方法 (密集嵌入和 LSTM 网络) 进行预测和排序,提高了问答的准确度,但由于源码中大量的 oov 词汇,深度学习模型的性 - 挖掘 Stack Overflow 的重复问题
本研究提出两个基于神经网络的架构来解决 Stack Overflow 中存在的问题复制,同时还通过显式建模问题中存在的代码进一步提高了检测质量。
- WSDMHeteroQA:通过异构图建模学习多源信息问答
本研究提出一种区别于以往只使用文章或维基百科等信息来源的社区问答方法,利用多种异构信息源(MIS)的相关信息进行答案生成,并在 $ ext {MSM}^{ext {plus}}$ 和 AntQA 等数据集上进行的反复实验表明本方法在各项指标 - ACLAnswerSumm:一份手动策展的数据集与回答摘要生成管道
该研究使用机器学习和数据归纳技术,为 Community Question Answering (CQA) fora 提出了一种新的答案总结方法,以产生最能反映回答视角范围的摘要,这种方法使用了由专业语言学家策划的数据集进行训练,并实现了语 - MMSemEval-2016 任务 3:构建一个功能丰富的社区问答系统的超级团队
介绍我们在 SemEval-2016 Task 3 on Community Question Answering 中的系统,我们通过结合丰富的语义、词汇、元数据和用户相关特征,在子任务 C 上取得了最好的结果,在子任务 A 和 B 上也取 - SIGIRMatch$^2$: 用于相似问题识别的匹配超匹配模型
在社区问答中,为了更高效地服务于人们,提出了一种新的匹配模型 Match$^2$,可以通过比较两个问题的匹配模式来度量它们的相似度,该模型在 similar question identification 任务中表现优于以往的方法。
- MM机器翻译评估与社区问答相遇
本文将机器翻译评估方法应用于另一个问题:社区问答中的答案排序,采用一种结合 MTE 特征、丰富的句法和语义嵌入、高效建模复杂非线性交互的成对神经网络架构。评估结果表明 MTE 特征和成对神经网络架构都对结果有着显著的贡献,具有最先进的性能。
- MMSemEval-2016 任务 3: 社区问答
介绍了 SemEval--2016 的社区问答中的任务 3,包括英语和阿拉伯语,其中英语有三个子任务:问题 - 评论相似度(A),问题 - 问题相似度(B)和问题 - 外部评论相似度(C)。阿拉伯语有另一个子任务:为新问题重新排列正确答案( - MMSemEval-2017 任务 3:社区问答
SemEval-2017 任务三关于社区问答,重新运行了 2016 年的四个子任务,提供了 2015 年和 2016 年的所有数据作为训练数据,并为测试提供了新数据,同时添加了一个新的子任务 E,以便在更大规模的情况下使用 StackExc - MMSemEval-2015 任务 3:社区问答中的答案选择
本文介绍了 SemEval-2015 Task 3 的组织和结果,以分类好、坏或潜在相关的答案,并回答 List of all answers 的 Yes / No 问题。我们使用 Mechanical Turk 对英语进行了广泛的数据标记 - ACL基于贝叶斯优化的交互式文本排名:以社区问答和摘要为例的案例研究
本研究提出了一种交互式文本排序方法,使用贝叶斯优化来聚焦在高质量的候选项上,以更好地适应于小数据场景,应用于社区问答和提取式摘要中,较之现有交互式方法具有明显优势,同时发现所学习的排序函数可以作为强化学习中有效的奖励函数。
- AAAI社区问答中答案选择和答案摘要生成的联合学习
该研究利用新颖的联合学习模型解决 CQA 中答案冗余和长度问题,设计了一个以问题为导向的指针生成网络,同时利用答案给长回答降噪,构建了一个包含长回答和参考摘要的大规模 CQA 语料库 WikiHowQA,实验证明该方法可以有效地解决 CQA - MM社区问答中的评论分类全局线程级推断
本文介绍如何自动分类社区问答中某个问题的答案,并利用输出结构和图割和整数线性规划等方法做出更加一致的全局决策。在 SemEval-2015 任务 3 数据集上测试后,结果证明使用串级别信息的重要性。
- 在社区问答网站中识别不清晰的问题
本研究提出了一种问题清晰度分类方法,该方法通过类似问题进行分类,以此作为基础为问题制定支持用户界面的开发提供可行的替代方案,并对其进行了与文本分类基线的比较。