透明度、隐晦性和问题提出的几何学

MMSep, 2018

透明度、隐晦性和问题提出的几何学

Opacity, Obscurity, and the Geometry of Question-Asking

Christina Boyce-Jacino, Simon DeDeo

TL;DR本文研究问题的难度，并指出模糊性与稀有性两个维度影响问题回答的难度，同时发现问题复杂度、答案网络密度、线索交叉性及信号词的存在也会影响问题的难度。同时，通过本文的研究成果，指导个体在提问和学习过程中跨越领域困难，增强理解。

Abstract

Asking questions is a pervasive human activity, but little is understood about what makes them difficult to answer. An analysis of a pair of large databases, of New York Times crosswords and questions from the quiz-show Jeopardy, establishes two orthogonal dimensions of question difficulty

question difficulty obscurity opacity synergistic information bayesian models

发现论文，激发创造

深入探究匿名性：Quora 问题的大规模分析

通过 5.1 万个问题的分析，揭示了社交问答平台 Quora 上匿名和非匿名问题的差异：匿名问题的提问者更倾向于谈论抑郁、焦虑以及个人的问题，且匿名群体与外向性、宜人性呈现正相关，与开放性质呈现负相关；此外，对于个人与敏感问题的回答，社区支持和用户参与度更高。

Nov, 2018

(QA)$^2$: 带问题假设的问答系统

本文提出了（QA）$^2$（包含有问题上有问题的问题的问题回答）的开放域评估数据集，用于测试有问题上有问题的问题的回答系统。该论文研究问题上有问题的问题，旨在解决现有的 QA 系统不能正确回答该类问题的问题。

Dec, 2022

AmbigQA：回答模糊的开放领域问题

本研究介绍了一项新的开放领域问题解答任务 AmbigQA，其中包括找到每个可能的答案，然后为每个答案重写问题以解决歧义问题。我们还构建了 AmbigNQ 数据集，该数据集涵盖了来自 NQ-open 的 14,042 个问题，并发现 NQ-open 中超过一半的问题存在不同源头的歧义，并且我们提出了一种强大的基础模型，表明我们的新任务和数据将支持未来的研究工作。

Apr, 2020

开放领域信息寻求对话中的澄清问题

本文介绍了在开放领域信息寻求对话系统中提出澄清问题的任务，并提出了一个离线评估方法和一个命名为 Qulac 的数据集，以便评估模型的性能，其实验表明优质问题有助于提高信息检索的效率，并提出一个由三个部分构成的检索框架，该模型显著优于竞争基线。

Jul, 2019

利用包含问题、答案和修订的数据库回答模棱两可的问题

通过利用来自维基百科的明确问题数据库，我们提出了一个新的用于回答含糊问题的最新方法，在含糊问题的多个答案的总结中，我们的方法在回收率指标上提高了 15%（相对改进），在评估从预测输出中消除模糊问题的指标上提高了 10%。从生成的问题数据库检索还可以在多样的篇章检索中取得巨大的改进。

Aug, 2023

计算机系统中的不透明度源：朝着一个全面的分类法

现代计算机系统在当代生活中无处不在，但其中许多系统仍然不透明。我们认为实现系统透明性的最佳策略因特定上下文中普遍存在的不透明性来源而异。通过综合和扩展现有讨论，我们提出了一个包含八个不透明性来源的分类体系，分为三个主要类别：架构、分析和社会技术。对于每个来源，我们提供了初步的建议以解决实践中导致的不透明性。该分类体系为需求工程师和其他从业人员提供了一个起点，以了解具有上下文普遍性的不透明性来源，并选择或开发适当的克服策略。

Jul, 2023

如何提问？以不确定性为指导的目标导向问题

本篇论文提出了基于贝叶斯模型和不确定性感知的信息寻求模型，以解决视觉对话问题中 agent 提出问题的困难。实验结果表明，在两种挑战性的问题中，我们的方法都优于其它相应的方法。

Dec, 2018

在意见问答系统中建模歧义、主观性和不同观点

通过考虑个性化和模棱两可性，我们创建了一个包含大约 80 万个问题和 310 万个答案的新问题回答数据集，发现考虑主观答案的个性化因素能够得到定量上更好的答案，并提供更细致的支持性观点。

Oct, 2016

跨越和穿过：将填字游戏作为新的 NLP 基准引入

该研究提出将填字游戏作为新的自然语言理解任务，并公开发布了从纽约时报跨越 25 年的近九千个填字游戏的语料库规范，以及包含超过半百万个独特线索 - 答案对的开放域问答数据集，并探讨了多种处理方法及评价框架。

May, 2022

有选择性地回答含糊问题

我们从不确定性的角度研究了问答系统，提出一种基于采样的可靠度量方法并发现它在校准答案方面的表现优于模型准确率或自验证方法，这对于回答相对模糊的问题有更明显的改善效果。

May, 2023