BriefGPT.xyz
Ask
alpha
关键词
decision processes
搜索结果 - 5
EMNLP
LDM$^2$:一种模拟人类认知的大型决策模型与动态记忆增强
我们提出了一种名为 LDM^2 的新型模型,它利用动态记忆机制来构建动态提示,根据所面临的状态引导大型语言模型做出适当的决策。在两个交互环境中进行的广泛实验证明了 LDM^2 在得分和成功率方面优于基线模型,证明了其有效性。
PDF
7 months ago
反向决策建模:学习行为的可解释表示
通过开发一个逆向决策建模的框架,我们在这篇论文中提出了一种表达顺序决策行为的参数化表示的方法,该方法不仅泛化了现有的模仿 / 奖励学习工作,而且还打开了更广泛的行为表征研究问题的研究领域。
PDF
8 months ago
情境化策略恢复:自适应模仿学习建模和解释医疗决策
通过上下文化策略恢复(CPR),将建模复杂决策过程的问题重新构架为多任务学习问题,其中复杂决策策略由上下文特定策略组成。通过对模拟数据和真实数据的研究,CPR 在预测重症监护单位抗生素处方(相对于先前的最佳结果增加了 22%的 AUROC)
→
PDF
9 months ago
将因果和非因果解释相结合,生成胶囊内镜下疾病进展
本研究提出了一种统一的解释方法,结合了模型依赖和不依赖的解释,用于给定实例的自动决策,生成一组解释。通过无线胶囊内窥镜,验证了该方法的有效性。
PDF
2 years ago
随机过程讲义
这是一份关于 “随机过程” 的课程笔记,除了标准的随机过程理论之外,还包含了诸如 von Neumann-Birkhoff-Khinchin 遍历定理、宏观系统平衡概念、Markov Chain Monte Carlo、Markov 决策过
→
PDF
5 years ago
Prev
Next