- 基于 StyleGAN 先验的可扩展人脸图像编码:朝向人机协作视觉压缩
利用 StyleGAN 先验,本研究探讨了利用派生的分层表示构建有效的可伸缩编码范式以满足人和机器的需求。通过逐步学习三层编码分层语义表示,构建机器智能和人类视觉感知支持的渐进式范式,并通过分层可伸缩熵转换器降低层间冗余,达到高效压缩目标。 - 使用联合潜在空间能量先验学习层次特征
本文研究多层生成模型在学习分层表示中的基本问题,并提出了一种联合潜在空间的基于能量的模型,通过多层潜在变量实现了有效的分层表示学习,并对数据分布建模。
- SSHR:利用自监督层级表征进行多语言自动语音识别
通过使用自我监督学习 (SSHR) 的分层表示,我们提出了一种新方法来优化多语种自动语音识别 (ASR)。我们分析了自我监督学习模型的不同层次,发现了与语言和内容相关的信息,从相关的中间层中提取与语言相关的帧,并通过自注意机制引导针对特定内 - 面向时空视觉注意建模与理解的分层表示
该篇博士论文研究和开发了用于视频序列中的时空视觉注意建模和理解的分层表示。具体而言,我们提出了两个用于视觉注意的计算模型。首先,我们提出了一个上下文感知的生成概率模型,用于视觉注意建模和理解。其次,我们开发了一个深度网络架构,用于视觉注意建 - 自监督视觉表示学习的堆叠联合嵌入架构
本文介绍了使用堆叠式联合嵌入架构(JEA)来学习高度可分离的语义层次表示的方法,从而产生表现出更具独特的语义概念的表示空间,证明了其在语义分类上的有效性。
- HieNet:自动 ICD 编码的双向层级框架
本研究提出了一种新颖的双向层次框架(HieNet),其中包括个性化的 PageRank 算法、双向层次通道编码器和渐进预测方法,以解决医疗记录自动 ICD 编码中存在的异质性、标签不平衡和 ICD 代码之间复杂关系的挑战,两个广泛使用的数据 - 任务导向对话的词典注入语义分析
本文提出一种新的基于层次表示的语义分析模型,使用分裂跨度和词汇注入技术,解决动态槽值的问题,取得了 TOP 数据集上最新的最佳结果。
- ECCVStyleGAN 中潜在空间的分层语义正则化
本文研究了如何通过提出的层次语义约束器(HSR)来改善 StyleGANs 生成的图像的真实性和自然性,同时提出新的 Attribute Linearity Score (ALS) 来衡量属性变量的线性度。实验表明,HSR 可以对生成器学习 - 变率分层 CPC 用于语音中的声学单位发现
本文通过自监督学习探索了多层对比预测编码 (CPC) 模型对语音的分层表示,提出了一种基于不均匀下采样的模型,通过聚焦负采样和量化目标等方法增强了其对深度、离散性的优化,从而在 speech recognition 任务上得到了更好的效果, - Point-M2AE:基于多尺度掩码自编码器的分层点云预训练
提出 Point-M2AE,一种新的多层次自监督学习框架,用于使用 Masked Autoencoders 预训练 3D 点云的分层表示学习,其具有优越的性能并超过了其他完全训练的方法。
- 混合分层结构的循环神经网络和 EM 算法在自然语言处理中的应用
该研究提出了一种名为 EM-HRNN 的新型架构,通过隐式层次信息(例如短语)的学习,进一步发展了 EM 算法来处理隐藏层,使文本的分层结构更加简单,并且证明在文档分类任务中,EM-HRNN 模型能够优于其他基于 RNN 的模型和相似于 B - EMNLP对话状态跟踪的语义表述
采用层次表示的语义分析任务,以实现对话状态跟踪,并通过 TreeDST 数据集的编码器 - 解码器框架实现了比现有技术水平的 DST 方法更好的结果。
- 本地可塑性规则可使用自监督对比预测学习深度表征
这篇论文提出了一种受到神经科学和自监督深度学习最新进展启发的学习规则,使用局部,赫布规则进行权重更新,并具有深度分层的图像、语音和视频表示。
- ACL基于 Transformer 的多方对话分层上下文学习与跨度问答
本研究介绍了一种新颖的 transformer 方法,利用三种语言模型任务预训练 Transformer,并应用多任务学习进行精细调整,以实现基于跨度的问答,该方法在挑战性的 FriendsQA 数据集上表现得非常好。
- ICLR最大差异比赛:自适应比较分类器
本文中,我们提出了一种新的方法,将大规模的无标签图像库分别与模型进行比较,运用最大差异性比赛方法,使用 WordNet hierarchy 作为分类器的距离度量标准,通过对人工标记的图像集的比较提高图像分类器的性能。
- 逐步学习和分离层次表示
通过渐进式学习独立层级表示,本文提出了一种策略来提高 Deep Generative Models 如 Variational Auto-Encoder 的去纠缠性能,该模型从最抽象的表示开始学习,并逐渐增加网络结构以介绍不同层次的表示。在 - 带有结构学习的层次图池化
本文提出了一种新的 Hierarchical Graph Pooling with Structure Learning (HGP-SL) 图池化算子来生成图结构的分层表示,并将其与图神经网络相结合,专注于图分类任务。通过实验结果表明,这种 - ACLLSTM 网络可实现动态计数
本文系统评估了标准循环神经网络在动态计数和编码分层表示方面的能力,研究结果表明 LSTM 网络可以通过模拟简单的实时 k 计数机学习识别平衡的括号语言和多个括号语言的洗牌,并且单层 LSTM 通过识别 Dyck-1 语言的任务表现良好,但是 - 提高任务导向对话中的语义解析
本文针对基于任务导向的对话提出了基于分层表示的语义分析方法,并通过嵌入上下文、集成学习和基于语言模型的成对重新排名等三种不同的改进方式来优化模型,将可能存在的分层表示错误进行分类,并展示了三种方法分别纠正不同类型的错误,进而通过将三种技术相 - AAAI从生成器网络中诱导稀疏编码和与或语法
通过在生成器网络的特征图上应用稀疏操作,我们介绍了一种可解释的生成模型,该模型使用稀疏激活来获得有意义的分层表示,并且从底层到顶层的卷积核可以逐层地学习基元、对象部件和整个对象;我们提出了一种诱导图像的稀疏编码和 AND-OR 语法的方法,