- 使用 DeepRepViz 识别深度学习模型预测中的混淆因素
通过实验和模拟数据集的分析,我们展示了使用 DeepRepViz 与深度学习模型相结合的优势,该方案能帮助研究人员系统地检测潜在的混淆因素,并揭示依赖年龄、性别或图像伪迹等冗余信息的深度学习模型。
- 基于图学习的神经形态成像和分类
提出了一种新的图表示方法将事件数据与图转换器相结合,用于准确的神经形态分类任务。通过广泛实验表明,该方法在仅有少量事件和有限计算资源的困难真实场景中表现出优异效果,为嵌入移动设备的神经形态应用开辟了道路。
- Raijū: 强化学习引导的后渗透自动化安全评估网络系统
我们提出了 Raiju 框架,这是一个基于强化学习的自动化方法,可帮助渗透测试人员快速完成网络系统的后渗透安全评估过程。通过使用两种强化学习算法(A2C 和 PPO)训练智能代理,我们实现了自动选择和执行行动以利用目标系统中的漏洞,从而自动 - 神经概率后续主成分的不确定性量化
为了在安全关键领域中部署图像恢复模型,本文提出了一种通过神经网络在单次前向传递中预测后验分布的主成分,可靠地传达实例适应不确定性方向,实现与后验采样器相当的不确定性量化,在速度上提升数倍。
- 利用扩散模型中的信号泄漏偏差
扩散模型中存在一种偏倚,来自信号泄漏的偏差概率分布与噪声概率分布不一致,造成训练和推理过程不匹配。我们展示了当模型针对特定风格进行调整时,信号泄漏偏倚尤为显著,导致次优的风格匹配。最近的研究尝试在训练过程中避免信号泄漏,而我们则展示了如何利 - 通过利用目标语言上下文提升端到端会话语音翻译
在这篇研究中,我们介绍了如何在端到端语音翻译中引入目标语言上下文,以增强连贯性并克服扩展音频片段的内存限制。此外,我们还提出了上下文丢弃以确保对上下文缺失的鲁棒性,并通过添加说话者信息进一步提高性能。我们的上下文化端到端语音翻译方法优于孤立 - ICCV从 LAION-5B 到 LAION-EO:使用锚定数据集过滤数十亿张图像进行卫星图像提取
提出并演示了基于锚点数据集的提取方法,结合进一步过滤,用于卫星图像领域,从网络中获取高像素分辨率的文本和卫星图像对数据集 LAION-EO。论文概述了采集流程和数据集的一些特征。
- 动态提示学习:解决文本为基础的图像编辑中的交叉注意力泄漏问题
基于大规模的文本到图像生成模型,本研究针对图像编辑的问题,通过动态提示学习 (DPL) 方法修复交叉注意力图,实现对特定对象的精细图像编辑,防止对其他图像区域的意外更改。通过广泛的评估,DPL 方法在多个指标上取得了卓越的结果,尤其是在复杂 - 为什么角边缘损失对半监督异常声音检测很有效?
通过实验证明,最小化角度边缘损失还可以最小化紧凑性损失,从而避免学习平凡的解决方案,同时还能教会模型适用于在嘈杂条件下检测异常声音的表示方法。
- 快速网络调整:利用测试时反馈学习适应神经网络
提出了一种适应神经网络在测试时分布发生变化的方法,通过闭环系统和测试时反馈信号来在实时中进行网络的适应,该方法使用基于学习的函数来实现很好的效果,使适应比基准方法更加灵活和快捷。
- 利用拓扑学进行卫星和航空影像中领域自适应道路分割
通过远程感知图像的分割获取道路的精确方面对于自主车辆、城市发展规划以及实现可持续发展目标等很多实际应用非常有用。本研究提出了一种基于拓扑感知的无监督领域自适应方法用于道路分割,通过预测道路骨架作为辅助任务来强制施加拓扑约束,并利用基于连通性 - 研究儿童在 AI 问题形成过程中反映的价值观
了解儿童在训练 AI 模型(如可教授机器)的界面设计中的设计方式和价值观,可以增加这类活动的影响力,并指导未来技术的设计。在一个共同设计的会议中,一个团队由 5 个 7-13 岁的儿童和成年共同设计师参与了修改后的故事板上的 AI 问题构思 - 使用长短期记忆和时间序列模型进行算法投资策略的对冲特性研究(专业简体中文)
该论文提出了一种新颖的方法来对冒险资产组合进行对冲,当金融市场受到金融动荡的影响时。我们引入了一种完全新颖的方法,通过基于这些资产价格的集合算法投资策略(AIS)的层面而不是单个资产的层面,来进行多样化活动。我们采用四种不同的理论模型(LS - 通过草堆中的靓丽针使图像生成模型更上一层楼
通过在网络规模的图像 - 文本对上训练文本到图像模型,可以从文本生成广泛的视觉概念,但是这些经过预训练的模型在生成高度美学化图像方面往往面临挑战,因此需要进行美学对齐的预训练后处理。本文中,我们提出了质量微调方法,以有效地指导经过预训练的模 - MMOceanBench: 海平面高度版
海洋卫星数据、机器学习、OceanBench 框架、SSH 插值是该研究的主要关键词和研究领域。
- 统一的 B 样条教程
统一 B 样条、核心概念、矩阵表示。
- 人类运动学启发的基于骨架的视频异常检测
在这篇论文中,我们介绍了一种名为 HKVAD(Human Kinematic-inspired Video Anomaly Detection)的新思路,通过显式利用人类运动特征来检测视频异常。我们还提出了一种利用骨架姿态的运动特征,并使用 - 基于基准数据集的大型语言模型路由
通过重新利用基准数据集来学习 “路由器” 模型,我们解决了在一系列模型中为新任务选择最佳的大型语言模型的挑战,并展示了学习模型路由器在不同基准数据集上的效用和局限性,从而在所有任务中持续提高性能。
- 基于潜在图的生物医学表格数据半监督学习
通过建立潜在图来发现数据之间的内在关系,我们的方法在半监督学习中取得了最先进的结果,并且在三个生物医学数据集上进行了验证。
- SAF-Net: 使用多视角超声心动图检测心肌梗死的自注意融合网络
本研究提出了一种名为自注意力融合网络(SAF-Net)的新型视图融合模型,用于从多视角超声心动图记录中检测心肌梗死(MI)。SAF-Net 模型利用自注意机制学习提取的特征向量中的依赖关系,采用紧凑的架构,包括特征嵌入以降低维度,自注意机制