信息搜索中的风险与歧义：眼动模式揭示应对不确定性的情境行为

Jun, 2016

信息搜索中的风险与歧义：眼动模式揭示应对不确定性的情境行为

Risk and Ambiguity in Information Seeking: Eye Gaze Patterns Reveal Contextual Behaviour in Dealing with Uncertainty

Peter Wittek, Ying-Hsang Liu, Sándor Darányi, Tom Gedeon, Ik Soo Lim

TL;DR本研究通过眼动实验探究在生物医学领域中，专家与新颖搜索界面的交互中，感知风险会如何影响用户的信息搜索策略及风险与模糊性之间的平衡关系，进而将信息搜索与量子决策理论联系了起来。

Abstract

information foraging connects optimal foraging theory in ecology with how humans search for information. The theory suggests that, following an information scent, the information seeker must optimize the tradeoff between →

information foraging exploration exploitation risk ambiguity

发现论文，激发创造

强化学习驱动的信息获取：量子概率方法

本文讨论交互式信息检索中的信息搜索行为，并将其视为一种基于强化学习的任务，使用量子力学的数学形式来描述和建模信息搜索者的不确定行为，为信息搜索者的行为提供指导。

Aug, 2020

自适应信息信念空间规划

该研究旨在使用奖励函数来有效地做出明智的决策，通过提出抽象观测模型来降低计算成本并推导出期望信息论奖励函数的界限以及价值函数的界限，同时，提出了一种用于改善聚合方法的方法，实现了相同动作选择的计算时间减少。

Jan, 2022

在交互和以用户为中心的算法补救中，利用偏好确定的初步探索

算法性回溯的研究目标在于为自动化机器学习模型所做出的可能不利决策提供可行性解释或改变方案。本文提出了一种基于引导互动模式的交互范式，旨在引导用户表达偏好并引导他们采取有效的改变方案。作者通过在虚构的借贷任务中进行对比，将该方法与基于替代方案和用户自行配置的自由性的探索互动模式进行比较。结果显示，用户可能认为引导互动范式提高了效率，但也感到在 “假设” 场景下的自由度较低。然而，对于纯探索界面所花费的时间通常被视为缺乏效率，从而降低了其吸引力、明确性和可靠性。相反，对于引导界面，时间的增加似乎提高了其吸引力、明确性和可靠性，而不会影响到用户对其效率的感知。这可能表明这种类型的界面应该将这两种方法结合起来，既支持探索行为，又慢慢引导朝着有效解决方案的方向前进。

Apr, 2024

贝叶斯激励兼容赌徒探索

研究说明在互联网经济和医疗决策等环境中，每个决策者对信息进行开采利用，并产生可能有助于未来决策的信息，社会规划者通过信息披露来鼓励代理商在探索和开采之间取得平衡，从而最大化社会福利，文中提供了一个多臂赌博问题的激励兼容算法，其遗憾在所有多臂赌博算法中（不管是否具有激励兼容性）是渐进最优的。

Feb, 2015

竞争环境下探索的危险：一种计算建模方法

通过对探索和竞争之间的相互作用进行实证研究，我们发现：在数字经济中，数据作为进入在线市场的一个障碍，可能促使更好的算法的产生，获得更高的消费者福利；在有竞争的市场中，探索可能会损害系统的声誉，进而降低市场份额，而第一个进入市场的公司则可能促进更好的算法的出现从而提高客户福利。

Feb, 2019

利用信息控制偏差：数据探索过拟合的程度如何？

提出了一种基于信息使用的方法来量化和限制任意探索性分析的偏差和其他误差指标，在此基础上分析和评估了过滤、排名选择和聚类等特定探索性分析方式的偏差。同时，该方法引出了随机化技术，可以证明减少了探索偏差同时保留了数据分析效用，从而帮助解决科学中的可重复性危机。

Nov, 2015

基于贝叶斯信息增益的认知情绪激发潜力建模：由自由能波动驱动的查询循环

通过应用高斯生成模型，本研究发现 KLD 和 BS 形成一个随着惊异（最小化自由能和预测误差）的上凸函数，类似于 Berlyne 的激活潜力函数或 Wundt 曲线，从而提出了一种用于解释 Wundt 曲线的信息增益函数的数学框架，并提出了一种由认知情绪驱动的理想调查过程。

Dec, 2023

贝叶斯探索：在贝叶斯博弈中激励探索

本文研究了在互联网经济中个体决策者在制定战略选择时的信息生产和消费，重点关注探索、开发和利益激励之间的平衡，并提出了一种不使用任何货币转移的建议政策设计方法以协调决策者。结果表明，经过实验模拟，设计的建议政策可以达到恒定的遗憾值，即使在面对随机收益时也可以达到对数遗憾。

Feb, 2016

达尔文阅读笔记中的维多利亚科学探索与利用

我们研究了查尔斯・达尔文的阅读选择，并使用主题模型计算其表现出的探索 (exploitation) 与开拓 (exploration) 决策方式的变化。通过计算 Kullback-Liebler 差异，我们发现达尔文的行为从早期的开拓（expolitation）转向了后期的探索（exploration）, 寻求相对于先前时代异常高的认知惊奇。这种变化，与他职业生涯的重大智力时期以及他自己的自我评论相一致。

Sep, 2015

决定学习什么时的信息价值

探究决策代理如何在不完全了解环境的情况下，通过理性获取信息构建最优学习目标，同时基于信息导向采样（information-directed sampling）和速率失真理论（rate-distortion theory）提出了一种有效的学习目标设计和信息获取方法，通过实验证明了信息获取在决定学习内容方面的价值。

Oct, 2021