- 人工神经网络中的潜在通信
通过识别神经表示、潜在空间、潜在交流、相对表示和数据模态关键词,研究发现神经网络的潜在表示具有普适性和可重用性,可以在不同模型之间传递和转化,实现生成、分类和检索等任务,跨图像、文本、音频和图形等各种数据模态。
- 操作潜空间
通过自我监督学习研究潜在空间的构建,支持语义有意义的操作;操作性潜在空间不仅展示语义结构,如聚类,还支持具有内在语义意义的常见转换操作。
- 最小卷积潜空间中带有条件 Sinkhorn 生成对抗网络的贝叶斯反问题
利用最少体积这一新颖的非监督非线性降维方法解决高维、非线性和模型不确定性等问题,从而实现后验推断,为逆问题提供了潜在条件生成模型的训练方法。
- 神经 - ABC:关于有衣物的关节体的神经参数模型
本文介绍了 Neural-ABC,一种基于神经隐式函数的新型参数模型,可以使用离散的潜在空间来表示着装的人体,涵盖身份、服装、形状和姿势。该模型通过利用神经隐式函数的优势,并结合精心设计的结构来满足必要的要求,使用有符号距离函数表示基础身体 - AID:文本图像扩散的注意力插值
条件扩散模型通过注意力插值技术实现图像的无缝插值,可用于处理潜在空间的插值问题,同时解决了文本或姿势等特殊条件下的插值问题,并提供了更好的一致性、平滑性和效率性。
- 主动深度核学习分子功能:实现动态结构嵌入
通过使用深度内核学习 (Deep Kernel Learning, DKL) 对分子探索进行主动学习方法,本研究与传统变分自编码器 (Variational Autoencoders, VAEs) 对比,揭示了潜变量空间中稀疏规律性的限制, - 利用变压器量化变分自编码器改进离散潜空间中的语义控制
通过使用 Vector Quantized Variational AutoEncoders (VQVAEs) 内的离散潜空间来提高 Transformer-based VAE 中的语义控制和生成性能,我们提出了一种新型模型 T5VQVAE - 零样本模仿策略通过演示数据集搜索
使用预训练的基础模型的潜在空间索引演示数据集,通过复制类似情境中的行为来解决具有计算成本的训练过程和策略适应问题,实验结果显示该方法在准确性和知觉评估方面明显优于基于学习的模型,能在 Minecraft 环境中以人类样式表现出智能行为。
- INFAMOUS-NeRF: 利用语义对齐的超网络和神经辐射场改进面部建模
我们提出了 INFAMOUS-NeRF,一种隐式可塑性人脸模型,通过引入超网络到 NeRF 中,改善在训练多个主题时的表示能力。同时,INFAMOUS-NeRF 通过学习语义对齐的潜在空间来解决了经典超网络在表示能力和可编辑性之间的权衡问题 - AAAIMimic:语音驱动三维面部动画的说话风格解耦
通过创新的说话风格解缠方法,我们提出了一种名为躺椅的新框架,用于学习面部运动的解缠表示,并通过建立风格和内容的二个潜在空间来实现任意主题说话风格的编码,从而实现更真实的语音驱动面部动画的合成。
- AAAI导航基于骨架的动作识别的开放集场景
本文探讨了开放集骨架动作识别(OS-SAR)任务的挑战,并提出了一种基于距离的跨模态集成方法,通过对骨骼关节、骨头和速度进行交叉模态对齐,在训练过程中使用交叉模态均值最大差异抑制机制,测试过程中使用基于距离的交叉模态逻辑改进方法,从而实现优 - RING-NeRF:基于残差隐式神经网络格的通用架构
我们介绍了一种名为 RING-NeRF 的新的简单而高效的体系结构,基于 Residual Implicit Neural Grids,用于控制场景和潜在空间之间映射函数的细节级别,并结合距离感知的正向映射机制和连续的粗 - 细重建过程,在 - 镜中机器人:通过关联自监督模型学习模仿
我们通过联合不同的自监督模型来构建一个定制模型,以解决智能机器人通过镜子观察自身并学习从图像中检测自己身体的 3D 姿势的问题。我们展示了该方法的实例,并通过对模型的部署进行了较全面的研究和评估,以提高模型的性能和调整超参数。
- 从图表到图谱:将隐藏空间合并为一体
通过在语义相关的数据集和任务上训练的模型,我们研究了聚合这些潜在空间以创建包含组合信息的统一空间。我们引入了相对潜在空间聚合(Relative Latent Space Aggregation)作为一个两步方法,首先使用相对表示使空间可比较 - 利用变分自动编码器探索调性音乐的潜在空间
我们评估了在 371 首巴赫合唱曲中对音乐认知的音乐语料库进行训练的变分自编码器(Variational Autoencoders)对于代表五度音程和音乐认知中的每个关键组件音高的等级关系定义潜在空间的程度,结果表明,音高离散傅里叶变换(P - 语义对齐下的潜在空间翻译
通过简单的转换,我们的研究展示了神经网络模型中学习到的表示可以在不同的预训练网络之间进行转化,从而有效地连接编码器和解码器,并实现在多模态设置下的出色分类性能。
- 基于非结构化生成模型的可探索网格变形子空间
通过在预训练的生成模型子空间中构建一个易于导航的二维探索空间,将给定的一组标志性形状的变化转化为变形场,以便将这些变化传递到高质量的网格模型。
- 深度变分多元信息瓶颈 —— 变分损失的框架
通过信息论,我们提出了一个可以重新演绎和推广现有变分方法,并设计新方法的统一原则。我们的框架基于多变量信息瓶颈的解释,其中两个贝叶斯网络相互权衡。我们将第一个网络解释为编码器图,指定了在压缩数据时要保留哪些信息;我们将第二个网络解释为解码器 - 潜空间中的流匹配
本文提出了一种在预训练自编码器的潜在空间中应用流匹配的方法,以实现高分辨率图像合成的计算效率和可扩展性的提高,并将各种条件集成到流匹配中进行条件式生成任务,包括标签条件下的图像生成、图像修复和语义到图像的生成。通过大量实验,本方法在各种数据 - 通过可学习度量过滤器的扩散跳跃 GNNs 实现同质化
提出使用渐进扩散差距的方法进行跳跃的扩散 - hops exploration,从而产生更具有动态支持的结构过滤器,建议用 Dirichlet 问题作为一种方法来在异类亲缘而不相关的标签分布的情况下学习逐段平滑的积淀空间,并使用 (可学习的