- 使用潜在扩散模型的受监督图异常检测数据增强
GODM 是一种用于缓解监督图异常检测中类别不平衡问题的数据增强方法,通过潜在扩散模型生成类似真实异常节点的合成图数据,并通过迭代去噪学习真实有机数据的潜在空间分布。
- 朝向稳健且通用的训练:基于输入扰动的噪声槽填充的实证研究
存在对话场景中的未知输入噪声,已有的受监督槽填充模型在实际应用中性能低下;通过引入一个名为 Noise-SF 的噪声鲁棒性评估数据集,本文的提出的框架可以有效地提高模型的鲁棒性。
- HyperTransformer: 监督和半监督少样本学习的模型生成
本文提出 HyperTransformer,一种基于 Transformer 的监督和半监督 few-shot 学习模型,该模型直接从 support 样本中生成卷积神经网络(CNN)的权重。通过将小型生成的 CNN 模型对特定任务的依赖性 - 探索有监督学习和自监督学习之间的协同作用:迈向多语言机器翻译的下一个 1000 种语言
通过混合监督和自我监督目标的方法,实现了覆盖数百种语言的多语言机器翻译模型的构建,该方法可在零资源情况下生成高质量翻译,甚至超过低 - 中资源语言的监督翻译质量。
- 指针图网络
本研究介绍了一种称为 Pointer Graph Networks(PGNs)的方法,该方法可将集合或图形增强为具有附加的推断边,从而提高模型的一般化能力。该方法直接受监督以对经典数据结构的长期操作进行建模,并综合了来自理论计算机科学的有用 - MM使用 GAN 进行盲去模糊
本文通过尝试不同的 GAN 结构和对现有结构的各种修改来提高其在监督去模糊中的性能,其中包括使用注意力模块和残差连接,同时添加经典损失函数(L1,L2 和感知损失)来训练 GAN,以及采用反馈模块以保留长期依赖关系。
- ACL基于问答奖励的摘要生成引导
本文提出了一种利用问答奖励来引导监督式摘要系统的新框架,通过人类摘要获得问答对来评估总结与原文件的关系,并且该系统学习如何推广信息量大、流畅度高且在问答方面表现良好的总结,结果表明其表现优于基线总结和人类评估。
- 用自编码器二分类器实现有监督的异常检测
本文提出了 Autoencoding Binary Classifiers(ABC),一种基于自编码器的新型监督异常检测器。ABC 是一种概率二元分类器,可以有效利用标签信息,并且以编码顺序优化模型对正常数据点的再现误差最小化,对已知异常最 - 粗粒化分子动力学力场的机器学习
本文应用监督式机器学习方法将经典粗粒化 (coarse-graining) 重新解释,提出了一种名为 CGnets 的深度学习方法,能够学习细粒度有溶剂共存 (all-atom explicit-solvent) 的自由能函数,并能够捕获多 - 基于流式主动学习策略的信用卡实时欺诈检测:评估与可视化
本文研究了信用卡欺诈检测的问题,提出了一些主动学习的策略,并比较了不同的查询标准,强调了在欺诈检测中主动学习存在探索 / 开发的权衡。
- SemEval-2017 任务 1 中的 CompiLIG: 用于语义文本相似性的跨语言抄袭检测方法
使用基于语法、字典、上下文和机器翻译的多种方法,并采用无监督和有监督的方式组合,我们的最佳运行在 SemEval-2017 的 STS Track4a 中排名第一,与人类注释的相关性达到 83.02%。
- 如何评估监督哈希?
本文提出两种基于检索和基于迁移学习的监督式哈希评估协议,并提供了两种基准方法来评估监督哈希方案的性能。
- MM众包的监督集体分类
本论文提出一种有监督的集成分类算法,旨在确定训练数据(例如,具有已知标签的项目)中可靠的标注者(即加权因子),使用马鞍点算法来确定每个标注者的可靠性,研究结果表明,有监督的方法可以比无监督的方法获得更好的分类准确性,而我们提出的方法优于其他 - 大数据分类技术综述
本文研究了不同的有监督分类技术,探讨了其优缺点。
- Python 中的机器学习:Scikit-learn
Scikit-learn 是一个 Python 模块,集成了各种最先进的机器学习算法,用于解决中等规模的监督和无监督问题,旨在将机器学习带给非专业人士使用通用高级语言,注重易用性,性能和一致的 API。