- 基于扩散模型的流场生成预测
我们提出了一种几何到流场扩散模型,利用障碍物形状预测障碍物后的流场。该模型基于可学习的马尔可夫转移核函数,从高斯分布中恢复数据分布。马尔可夫过程以障碍物几何形状为条件,在每一步估计需要消除的噪声,通过 U-Net 实现。交叉注意机制将几何形 - Style-NeRF2NeRF: 从样式对齐的多视图图像中进行三维样式转移
通过使用 2D 图像扩散模型来改良 3D 场景,我们提出了一种简单但有效的流程;通过细化源 NeRF 模型以及使用风格化图像生成的样式对齐的图像扩散模型,实现 3D 风格转移。
- 基于 CNN 编码器 - 解码器框架的压缩图像字幕生成
我们的项目旨在通过开发结合卷积神经网络(CNN)和编码 - 解码模型的自动图像字幕架构来解决图像字幕的挑战。我们还进行了性能比较,研究了多种预训练 CNN 模型的性能变化,并探索了频率正则化技术在压缩 “AlexNet” 和 “Effici - 基于额纹的时空网络的用户验证:FH-SSTNet
通过学习 3D 时空卷积,创建额头图案的详细图片,我们提出了一种新的 CNN 模型:额头时空卷积网络(FH-SSTNet),利用三元损失来提取区分性特征,并利用 Arcloss 提高模型的鉴别能力。在包含 247 个独特主题的额头皱纹版本 - 多类实时碰撞风险预测:基于卷积神经网络的伊斯坦布尔案例研究
该研究通过使用人工神经网络(ANN)来预测事故风险,在分析交通和天气数据后,选择相关特征作为输入数据,并使用卷积神经网络模型学习处理这些特征,最终表现出较其他模型更好的性能,建议将其作为多类别预测模型来实时预测事故风险。
- 卷积神经网络中的 DiffStride 和 Spectral Pooling 的混合
本研究提出了一种卷积神经网络模型,通过反向传播结合频谱汇聚技术,执行学习可调步长技术的下采样,旨在保留图像中的大部分信息。与基线方法 DiffStride 相比,DiffStride 与频谱汇聚的混合方法在准确率上提高了 0.0094。
- 糖尿病视网膜病变特征提取和分类的卷积神经网络模型
应用人工智能技术于医疗市场在及时诊断类似糖尿病视网膜病变这类悄无声息的疾病方面引发了日益关注,我们通过提出一种新型的卷积神经网络模型,借助眼底图像作为输入,可以识别到糖尿病视网膜病变的严重程度,并通过卷积层对微小动脉瘤、棉絮斑、渗出物和出血 - 能否准确使用 CNN 分类人类情绪?一项基于深度学习的面部表情识别研究
该研究探讨了 CNN 模型识别和分类人类面部表情(积极、中立、消极)的能力,通过对芝加哥人脸数据库的预处理数据进行训练,模型在 10,000 张图像上达到 75% 的准确率,表明实现准确分析人类情感以及实用情感人工智能的可能性。
- 优化的深度特征选择用于肺炎检测:一种新的 RegNet 和基于 XOR 的 PSO 方法
通过使用基于异或运算的粒子群优化算法从 RegNet 模型的倒数第二层中选择深度特征来改进卷积神经网络 (CNN) 模型对肺炎检测的准确性,本研究提出了一种能够对儿童肺炎进行自动检测,从而在资源和专业知识有限的发展中国家中显著减少儿童死亡率 - ICCV域适应器:一种用于测试时适应的新方法
通过 AdaMixBN 模块和广义熵最小化 (GEM) 损失函数,本论文提出了一种名为 DomainAdaptor 的统一方法,用于进行测试时的适应学习,以最大限度地挖掘测试数据中的信息,并解决训练和测试样本之间的领域偏移问题,从而在四个基 - 使用卷积神经网络 (CNN) 结合 BOLD-fMRI 计算人体连接组发育队列中的单位时间呼吸体积 (RTV) 和呼吸变异度 (RV)
本研究提出了一种一维 CNN 模型用于重建两个呼吸参数,RV 和 RVT,结果表明 CNN 可以从静息状态的 BOLD 信号中捕获有用的特征并重建真实的 RV 和 RVT 时间序列,预期这种方法的应用将降低 fMRI 研究的成本、减少复杂性 - 透明且可控的网络学习:通过嵌入人类指导概念
本文提出了一种透明可控网络学习(TCNL)的方法来优化卷积神经网络模型的透明度和可控性,通过引入概念信息和建立概念特征提取器以及概念映射器等步骤,具体地实现了 TCNL 方法,提高了 CNN 模型的可解释性和人为控制性。
- 通过模块化和组合修复弱卷积神经网络模型
通过模块化和组合的方式,CNNSplitter 可以填补弱 CNN 模型,在不改变整个模型的情况下提高目标类(TC)的识别能力,并且实验结果表明在 3 个广泛使用的数据集上,CNNSplitter 可以显着提高 TC 的精确度和召回率,也可 - 这不是发废文,是我的猫在发文
本文提出了一种新颖的架构,可以为给定的输入图像生成滑稽的字幕。该架构分为两个部分:图像字幕生成和滑稽文本转换。
- 使用逐元素激活缩放增强卷积神经网络的鲁棒性
本文研究了通过精细调整激活元素以改进 CNN 模型的对抗鲁棒性的 Element-Wise 激活缩放方法,实验结果在 CIFAR10 和 SVHN 上表明,EWAS 显著提高了 ResNet-18 的对抗性准确性达到了 82.35%,是对提 - MM孟加拉车牌的自动识别方法
提出了一种自动扫描车牌并识别其字符的混合方法,其中使用了 YOLO 模型、Otsu 阈值和 CNN 模型,以便创新性地实现自动化车辆识别,随着的普及,这有助于防止盗用和滥用。
- 基于交叉带协同分析的 CNN 检测 GAN 生成的人脸图像
本文提出了一种利用交叉波段共生矩阵的方法来区分生成的合成图像和自然图像,用于生成合成脸部图像的真伪检验。该检测方法在光谱波段不一致性的基础上,在空间共同出现矩阵之外利用交叉频带共生矩阵,并利用 CNN 模型来训练识别真实和合成面部图像。实验 - CVPRSuperCaptioning: 利用二维词嵌入进行图像字幕生成
本研究提出了一种名为 SuperCaptioning 的方法,通过借鉴 Super Characters 方法中的二维词嵌入思想,在一个单一的 CNN 模型中同时处理语言和视觉信息,从而将图像字幕生成问题转化为图像分类问题,实验证明此方法可 - ACL基于子图排名和联合打分的简单问答
提出了一个统一框架来描述和分析已有的知识图谱简单问题回答方法,通过提出一种新的排名方法来改进子图选择,并提出了一个联合评分 CNN 模型,采用新的损失函数来利用主题 - 关系依赖性并实现得分的良序,从而在 SimpleQuestions 数 - CVPR无监督深度跟踪
该论文提出了一种无监督视觉跟踪方法,使用 CNN 模型和监督学习相反,采用大规模未标记视频进行无监督训练,采用多帧验证方法和成本敏感损失来促进无监督学习,取得了与完全监督追踪器相当的基准精度,同时展示了利用未标记或弱标记数据进一步提高跟踪精