透明度、隐晦性和问题提出的几何学
通过 5.1 万个问题的分析,揭示了社交问答平台 Quora 上匿名和非匿名问题的差异:匿名问题的提问者更倾向于谈论抑郁、焦虑以及个人的问题,且匿名群体与外向性、宜人性呈现正相关,与开放性质呈现负相关;此外,对于个人与敏感问题的回答,社区支持和用户参与度更高。
Nov, 2018
本文提出了(QA)$^2$(包含有问题上有问题的问题的问题回答)的开放域评估数据集,用于测试有问题上有问题的问题的回答系统。该论文研究问题上有问题的问题,旨在解决现有的 QA 系统不能正确回答该类问题的问题。
Dec, 2022
本研究介绍了一项新的开放领域问题解答任务 AmbigQA,其中包括找到每个可能的答案,然后为每个答案重写问题以解决歧义问题。我们还构建了 AmbigNQ 数据集,该数据集涵盖了来自 NQ-open 的 14,042 个问题,并发现 NQ-open 中超过一半的问题存在不同源头的歧义,并且我们提出了一种强大的基础模型,表明我们的新任务和数据将支持未来的研究工作。
Apr, 2020
本文介绍了在开放领域信息寻求对话系统中提出澄清问题的任务,并提出了一个离线评估方法和一个命名为 Qulac 的数据集,以便评估模型的性能,其实验表明优质问题有助于提高信息检索的效率,并提出一个由三个部分构成的检索框架,该模型显著优于竞争基线。
Jul, 2019
通过利用来自维基百科的明确问题数据库,我们提出了一个新的用于回答含糊问题的最新方法,在含糊问题的多个答案的总结中,我们的方法在回收率指标上提高了 15%(相对改进),在评估从预测输出中消除模糊问题的指标上提高了 10%。从生成的问题数据库检索还可以在多样的篇章检索中取得巨大的改进。
Aug, 2023
现代计算机系统在当代生活中无处不在,但其中许多系统仍然不透明。我们认为实现系统透明性的最佳策略因特定上下文中普遍存在的不透明性来源而异。通过综合和扩展现有讨论,我们提出了一个包含八个不透明性来源的分类体系,分为三个主要类别:架构、分析和社会技术。对于每个来源,我们提供了初步的建议以解决实践中导致的不透明性。该分类体系为需求工程师和其他从业人员提供了一个起点,以了解具有上下文普遍性的不透明性来源,并选择或开发适当的克服策略。
Jul, 2023
本篇论文提出了基于贝叶斯模型和不确定性感知的信息寻求模型,以解决视觉对话问题中 agent 提出问题的困难。实验结果表明,在两种挑战性的问题中,我们的方法都优于其它相应的方法。
Dec, 2018
通过考虑个性化和模棱两可性,我们创建了一个包含大约 80 万个问题和 310 万个答案的新问题回答数据集,发现考虑主观答案的个性化因素能够得到定量上更好的答案,并提供更细致的支持性观点。
Oct, 2016
该研究提出将填字游戏作为新的自然语言理解任务,并公开发布了从纽约时报跨越 25 年的近九千个填字游戏的语料库规范,以及包含超过半百万个独特线索 - 答案对的开放域问答数据集,并探讨了多种处理方法及评价框架。
May, 2022
我们从不确定性的角度研究了问答系统,提出一种基于采样的可靠度量方法并发现它在校准答案方面的表现优于模型准确率或自验证方法,这对于回答相对模糊的问题有更明显的改善效果。
May, 2023