利用粗略监督改善少样本部件分割
使用大脑 fMRI 响应预测作为训练目标,我们研究了视觉数据、深度网络和大脑之间的有趣联系,发现通过不同目标训练的深度网络共享通用的特征通道,将这些通道聚类成不同的大脑区域,产生语义相关的物体片段,同时通过通道聚类发现了不同网络层级处理视觉信息的过程,从而实现了网络之间的精确比较。
Jun, 2024
发展一种能够有效聚合 sLLM 和 LLM 在初始度上的预测结果以便后续由 sLLM 生成的标记能更准确影响,通过对 sLLM 的置信度自适应性地超信任或忽略 LLM 的预测,我们证明我们的方法在各种模型和数据集上提供了一致的改进。
Jun, 2024
通过无监督学习非线性时间序列的低维表示方法,该方法基于每个序列服从自身的自回归模型并通过低秩约束与其他序列相关联的假设,可以用于聚类和分类等机器学习任务,并且在真实时间序列数据上展示了有竞争力的性能和符号文本建模和 RNA 序列聚类的有效性。
Jun, 2024
通过深度神经网络的研究,我们发现 grokking 现象对于深层网络更为敏感,且特征排名的减少与过拟合到泛化阶段的相变存在关联,特征排名可能比权重范数更能指示模型的泛化行为。
May, 2024
利用分解与整合方法的 DecomCAM 对复杂深度网络进行解释,突出显示模型决策基础的区域,提供清晰的显著性图和详细的可解释性,通过对目标概念的贡献进行集成,实现了定位准确性、可解释性和计算效率的优化平衡,有可能成为高级深度学习模型细粒度解释的工具。
May, 2024
生成对抗网络(GAN)已经成为一种生成高保真数据的强大工具,并且采用监督方法提出了 Monte Carlo GAN(MCGAN)算法,以解决现有方法在生成器训练上缺乏监督导致的振荡与性能不佳的问题,并且数值结果表明 MCGAN 在质量、准确性、训练稳定性和学习潜在空间等方面明显且一致地改进了现有的 GAN 模型。
May, 2024
Part123 是一种新颖的从单视图图像进行部分感知三维重建的框架,通过扩散模型生成多视角一致图像,并利用 Segment Anything Model (SAM) 生成多视角分割蒙版,然后通过对比学习将 2D 基于部分信息有效地结合到三维重建中,实验结果表明该方法可以在各种物体上生成具有高质量分割部分的三维模型,相较于现有无结构重建方法,该方法产生的部分感知三维模型对于特征保持重建、基本形状拟合和三维形状编辑等重要应用有益。
May, 2024
医学图像数据中,现有深度网络模型对于不同医院采样的数据或受性别、种族等人口统计变量影响的数据领域转移问题的鲁棒性不足。本研究提出了一种基于医学知识先验的知识增强瓶颈模型(KnoBo),通过检索增强语言模型,设计适当的概念空间,并采用自动训练过程来识别概念,以提高医学模型对领域转移的适应能力。在广泛的 20 个数据集上评估了不同知识资源和识别架构,在混淆数据集上,KnoBo 的性能平均超过精调模型 32.4%。最后,评估表明 PubMed 是使医学模型对领域转移的敏感性降低的有希望的资源,在信息多样性和最终预测性能上优于其他资源。
May, 2024
基于群表示论,我们提出了一个统一的构造性通用逼近定理,涵盖了包括浅层和深层神经网络在内的广泛学习机。我们通过研究向量值联合群等变特征映射的方法,扩展了 Sonoda 等人最近发展的系统方法,从而对复合非线性激活函数定义的真实深层网络进行了形式化的通用逼近定理的证明。
May, 2024
利用深度学习技术,本研究通过 8 种不同的深度网络架构在两个不同的艺术数据集上进行对比实验,并引入一种通过多个模型提取和识别输入的不同特征的可变方法,创造了与现有工作相比更一致的模型,在最大艺术数据集上达到了最新的精确度(WikiArt - 68.55%),同时讨论了数据和艺术风格本身对模型性能的影响。
May, 2024