英语和阿拉伯语社区问答的解决方案
本篇论文研究了如何在社区论坛中寻找相关问题,尤其是当新问题的语言与现有问题不同时,我们采用基于核的方法和前馈神经网络,通过大规模平行语料库训练机器翻译系统、双语词典和跨语言单词嵌入以解决该问题,并通过跨语言树核和跨语言嵌入的方法,使得在处理翻译文本方面的性能提高并且接近于单语言系统,但是整体而言,基于核的方法在所有情况下都表现更好。
Oct, 2017
在这项工作中,我们通过实证研究了社区问答论坛的几个方面,包括引入一种基于 BERT 的特征捕捉问题和答案的语义相似性、使用线性方式结合问题和答案特征、以及在 CQA 领域中采用迄今为止未使用过的排序学习算法等。在三个标准 CQA 数据集上,我们的提出的框架实现了最领先的性能,并分析了我们使用的特征的重要性。这项工作有望指导实践者在 CQA 检索任务中选择更好的特征集。
Sep, 2023
本文提出了一种新的基于单词对齐的方法来解决 FAQ 问题回答任务,并且实验证明,问题相似度模型比基线系统更有效,稀疏特征可使 top-1 准确度提高 5%,而学习排名算法显着优于传统方法。此外,本文的方法在答案选择任务上表现优异。
Jul, 2015
研究利用基于微调词嵌入和主题相似性的多个语义相似性特征寻找社区问答系统中的满意答案,其主要提交结果在 SemEval-2016 社区问答任务 3 的不同子任务中排名第三。
Nov, 2019
本研究对社区问答的答案排名进行了深入的研究,基于大规模的 Stack Overflow 问题和回答数据,利用深度学习方法 (密集嵌入和 LSTM 网络) 进行预测和排序,提高了问答的准确度,但由于源码中大量的 oov 词汇,深度学习模型的性能提升由限制,未来应开发新的方法以解决该问题。
Oct, 2022
介绍了 SemEval--2016 的社区问答中的任务 3,包括英语和阿拉伯语,其中英语有三个子任务:问题 - 评论相似度(A),问题 - 问题相似度(B)和问题 - 外部评论相似度(C)。阿拉伯语有另一个子任务:为新问题重新排列正确答案(D)。18 个团队参加了该任务,提供了总共 95 个运行结果。
Dec, 2019
RankQA 是一种新的神经问答模型,利用三阶段过程(检索、理解和重新排序)来自动回答问题,为后续基于内容的问答研究提供了有力的基线模型。
Jun, 2019
介绍我们在 SemEval-2016 Task 3 on Community Question Answering 中的系统,我们通过结合丰富的语义、词汇、元数据和用户相关特征,在子任务 C 上取得了最好的结果,在子任务 A 和 B 上也取得了强大的结果,其中元数据的组合对于问题和评论是最重要的,在子任务 A 和 C 中使用 QatarLiving 数据训练的语义向量和问题与评论之间的相似性,在子任务 B 中使用原始问题与相关问题之间的相似性。
Sep, 2021
本文介绍了一种在多任务设置中训练的端对端系统,使用任务特定的预训练模型作为深度特征提取器,以过滤和重新排列医学领域答案的方法来解决排名和大型文档分类等任务中输入大小限制和数据不足的问题,并在 ACL-BioNLP 研讨会 MediQA 问答共享任务上取得了 Spearman's Rho 为 0.338 和 Mean Reciprocal Rank 为 0.9622 的最高分数。
Jul, 2019