uncertainty | BriefGPT - AI 论文速递

关键词uncertainty

搜索结果 - 525

基于分割引导的 MRI 重建：实现具有显著多样性的重建
基于扩散模型的 MRI 重建方法中，引入了扩散过程的指导，生成对应于上限和下限分割的两个具有意义的多样化重建结果，通过这些界限之间的差异来量化重建的不确定性，该方法比重复抽样更可靠和更准确。
PDF2 days ago
面向不确定性下基于 DSA 的最优化卒中诊断与治疗的综合决策框架
该研究提出了一种针对中风诊断和治疗中的不确定性挑战的新方法，该方法采用了部分可观察的马尔可夫决策过程（POMDP）框架，有效地整合了先进的诊断工具和治疗方法，并在中风诊断中考虑到了固有的不确定性，从而改进了中风处理中的护理和结果。
PDF3 days ago
描绘技术未来：社交媒体话语中的主题、情感和情绪分析
使用 BERTopic 建模和情感分析对 2021 年至 2023 年的 150 万条推特进行研究，发现积极情绪明显超过消极情绪，关键意见领袖强调乐观和益处，强调他们在技术不确定时塑造未来愿景的重要角色。
PDF7 days ago
评估语言模型作为风险评分
当前的问答基准主要关注在可预测任务的准确性。本文聚焦于使用语言模型作为无法实现的预测任务的风险评分。我们引入 folktexts 软件包来系统地生成风险评分，并在基准预测任务中对其进行评估。我们发现零 - shot 风险评分在预测信号方面表
PDF8 days ago
揭示社交机器人：我们有多自信？
社交机器人在传播虚假信息方面仍然是一个主要渠道，其对公众构成威胁。本研究致力于解决社交机器人检测的挑战性问题，并在账户级别上提供不确定性的量化。该研究的双重关注使得我们能够利用与每个预测的不确定程度有关的附加信息，从而增强决策能力并提高机器
PDF9 days ago
在线决策的自适应基础模型：具有快速增量式不确定性估计的超级智能体
GPT-HyperAgent 是 GPT 的改进版本，用于处理基于自然语言输入的在线决策问题中的不确定性，通过与 HyperAgent 相结合，实现了可扩展的探索。它在实验中验证了其在实际的安全关键决策中的有效性。
PDF9 days ago
VegeDiff：地理空间植被预测的潜在扩散模型
在全球气候变化和频繁极端天气事件的背景下，准确预测未来地理空间植被状态变化至关重要。为了解决这一问题，本研究提出了 VegeDiff 模型，通过扩散模型概率地捕捉植被变化过程中的不确定性，从而生成清晰准确的未来植物状态。该模型能够分别模拟动
PDF10 days ago
ECCV基于门控时间扩散的随机长期密集预测
提出了一种新颖的 Gated Temporal Diffusion (GTD) 网络来模拟观测和未来预测的不确定性，通过引入 Gated Anticipation Network (GTAN) 作为生成器，以相互表示的方式对视频的过去和未来
PDF11 days ago
Al 增强安全流程中的不确定性传播风险
使用人工智能技术在软件系统的安全开发中逐渐普及，将不确定性水平的基于人工智能的子系统组合成自动化流水线的趋势日益增长，这带来了根本性的研究挑战并对安全关键领域（如航空）构成了严重威胁。本文提供了捕捉不确定性传播的形式化基础，开发了一个用于量
PDF13 days ago
大型语言模型作为生物医学假设生成器的综合评估
生物医学知识、大型语言模型、假设生成、不确定性与生物医学发现是本研究的关键词和主题，在综合评估了大型语言模型作为生物医学假设生成器的能力后，研究发现大型语言模型可以生成新颖且经过验证的假设，而多智体交互和工具使用可以提高零样本假设生成的性能
PDF15 days ago
从循环到意外：不确定性下的语言模型回退行为
大型语言模型通常表现出不良行为，如幻觉和序列重复。我们将这些行为视为模型在不确定性下的后备方案，并研究它们之间的关联。通过对同一家族的模型进行广泛分析，在预训练令牌数量、参数数量或包含遵循指令的训练等方面的差异中，我们将后备行为归类为序列重
PDF19 days ago
机器能学习真实概率吗？
当存在不确定性时，AI 机器被设计成做出决策，以达到最佳预期结果。预期基于机器与之交互的客观环境的真实事实，并且这些事实可以以真实客观概率函数的形式编码到 AI 模型中。相应地，AI 模型涉及概率机器学习，其中概率应该以客观方式解释。我们在
PDF19 days ago
推进基于星座方法的概率论辩算法
在计算论证中，推理具有不可靠和冲突的知识是一个重要的研究领域。本文提出了一种算法方法来克服概率论证在推理任务中所面临的高计算复杂性难题，并通过动态规划算法在树分解上操作，实现了对一组给定的论证是否是完整扩展的概率进行计算。实验结果显示了该方
PDF21 days ago
嵌入匹配的半监督分割
利用深度卷积神经网络和半监督分割方法，在医学图像上实现髋骨分割，仅凭 4 个 CT 扫描图像达到了 3.30 的 Hausdorff 距离（95th 百分位数）和 0.929 的 IoU（交并比），超过了现有方法的最佳水平。
PDF22 days ago
学习图结构和不确定性以实现准确和校准的时间序列预测
STOIC 利用时间序列之间的随机相关性来学习时间序列之间的底层结构，以提供良好校准和准确的预测。在广泛的基准数据集上，STOIC 提供了约 16％更准确和 14％更好校准的预测。
PDF25 days ago
确信的不确定性：一种用于多模态认知和随机意识的基准和度量
在本文中，我们针对视觉 - 语言人工智能系统提出了关于不确定性的分类法，区分了由于信息缺乏而产生的认识不确定性和由于固有不可预测性而产生的因果不确定性，并进一步探讨了更加精细的分类。基于这个分类法，我们构建了一个对比性数据集 Certain
PDF25 days ago
用于二元问题回答的校准大型语言模型
利用归纳 Venn--Abers 预测器（IVAP）校准二元标签对应的输出标记的概率，我们的实验结果表明 IVAP 方法在各种标签标记选择下始终优于常用的温度缩放方法，能够产生良好校准的概率并保持高的预测质量。
PDFa month ago
正反提示：分析 LLMs 在自我改进生成中的判别能力
我们提出并分析了三种区分性提示：直接、反向和混合，以探索闭源和开源 LLM 在自我改进其生成性能方面的潜力，并揭示了哪种区分性提示最具有潜力以及何时使用它，从而降低生成不确定性。
PDFa month ago
寻求不确定性中的确定性：双阶段统一框架解决动态面部表情识别中的不确定性
研究结果显示，SCIU 框架在消除 Dynamic Facial Expression Recognition (DFER) 数据集中的不确定性方面具有显著的效果，并通过严格的实验验证实现了性能指标的显著提升。
PDFa month ago
大型语言模型是否表现出认知失调？研究揭示观点和陈述答案之间的差异
我们通过转化问题、多选题和直接文本补全的实验评估，研究了大型语言模型（LLMs）在因果推理、不确定性方面能力的量化，结果显示 LLMs 的表态答案与预测真实信念存在显著差异，提示它们的信念可能在多种情景和结果中存在多重偏见和不准确性，对于
PDFa month ago