- FATE: 基于 Transformer 的特征无关编码器用于学习流式细胞仪数据中的广义嵌入空间
通过学习一种通用的嵌入空间,我们提出了一种新型架构,能够直接处理具有不同特征集合的数据,从而实现对异构特征空间数据的共享潜在特征空间的学习。该模型的优势在于能够在不一致的特征空间中无缝操作,特别适用于数据稀缺的情况,例如急性髓性白血病流式细 - 文本 - 图像模型的数据归因评估
通过调整现有大规模模型的方法进行数据归属性的评估,我们能够构建出受样例影响的合成图像数据集,并在此基础上评估多种数据归属算法及不同的特征空间。
- GO-LDA: 广义最优线性判别分析
本文提出了一种新的多类别线性判别分析 GO-LDA 方法,通过构造每个步骤中最大化 Fisher 准则的正交鉴别方向可以分离投影数据。该方法在多种模式识别和分类问题上都能提高准确性。
- ICLR基于特征一致性预测的预测推断
本文提出了基于特征空间的符合性预测方法,利用深度学习的归纳偏差将该方法扩展到语义特征空间,从理论上证明其在温和假设下优于传统方法,并且结合不仅限于普通的符合性预测算法,还可以与其他自适应符合性预测方法结合,从现有的预测推断 benchmar - MM双流数据在线深度学习
本文提出了 OLD^3S 框架,实现在线学习的高效处理,针对在不断更新的特征空间上进行的数据流的学习问题。通过建立新旧特征空间之间的关系,发现一个共享的潜在子空间以总结旧和新特征空间的信息,构建中间特征映射关系,从而将模型容量作为可学习的语 - EMNLP揭示基于文本的情绪检测的限制
本研究利用 GoEmotions 和 Vent 两个情感分类的大型数据集,通过多种特征空间和学习算法设计了一个基准测试,并在 BERT 基础上提出了两个简单却有效的模型,超过了先前的强基线。通过人体实验分析了作家表达情感和读者感知情感之间的 - NIPS大规模神经系统识别:分离 “何时” 和 “何地” 信息
提出了一种卷积神经网络 (CNN) sparse 的架构,可扩展到数千个神经元和短期记录,可以端到端地训练,从而克服了 CNN 拟合神经数据中感受野位置估计的主要瓶颈,该模型的表现优于现有的小鼠初级视皮层系统识别模型。
- ICLR深入挖掘 CNN 层次结构:寻找 CNN 实现视角不变性的方法
本论文针对卷积神经网络 (CNN) 不同层次特征空间中的视角流形结构展开了研究,提出了一种测量视角流形变形和退化的方法,在多视角数据集上,通过精调预训练 CNN,实验证明了学习到的 CNN 表征可以实现视角不变性,并探究了其实现机制。
- 深度 SimNets
SimNets 是一种深度分层架构,在类卷积神经网络的基础上引入了相似函数与对数均值指数函数,从而实现了更强的表达能力和更广泛的特征空间,并且在计算资源受限的场景下具有显著的优势。
- 我们需要更多训练数据吗?
本文研究了对象识别系统的模型对各种类型数据大小的适应能力,主要使用了有向梯度特征的磨损模板以及合成的模板混合模型作为研究对象,并发现了混合模型的数量和正样本数量很容易饱和,提出了利用组合混合模型的方法进行训练和预测以及在大数据集上学习效率的 - 可视化物体检测特征
介绍了一种对物体探测器使用的特征空间进行可视化的算法,通过将视觉特征还原为多个自然图像来工作,并通过对高分假警报的特征进行可视化分析,探索了错误警报产生的原因并提出了矫正方法。
- ICML分布式树核
本研究提出了分布式树核方法以减少树核的时间和空间复杂度,并使用线性复杂度算法计算树的向量,嵌入低维空间,其中核计算是通过点积直接完成的,并证明了分布式树核速度更快,与树核相关,在 2 个自然语言处理任务中获得了具有统计学意义的类似性能。
- KDD特征重要性排名度量
本文介绍了一种名为 Feature Importance Ranking Measure(FIRM)的方法,通过回顾性分析任意学习机器,该方法能够达到优秀的预测性能和优越的解释性。与标准的原始特征加权不同,FIRM 考虑了特征之间的相关性结